Python
파이썬의 beautifulsoup으로 한글 hwpx에 있는 표를 읽어들여 csv로 생성하는 방법을 소개한다.
2024. 08. 22.
파이썬 script 파일을 실행할 때 인자를 추가해 코드를 실행해보자. 추가적으로 `.env` 파일에 인자로 받은 변수를 저장하는 방법도 설명한다.
2024. 08. 09.
도커로 실행되고 있던 Django에서 나타난 auth_user 에러를 해결해보자.
2024. 05. 16
파이썬의 라이브러리 gensim을 활용해 LDA 모델을 학습하고, pyLDAvis를 사용해 토픽의 분포를 시각화해보자.
2024. 05. 03.
Streamlit은 파이썬으로 웹 페이지를 간단히 만들 수 있는 라이브러리로, 파이썬으로 데이터 분석한 결과를 웹 페이지에 빠르게 시각화해보자.
2024. 04. 29.
flask로 구축한 API를 호출할 때 cryptography 패키지 오류가 나타났다. 이 오류를 해결하는 간단한 방법에 대해 알아보자.
2024. 03. 28.
서지 메타데이터를 다운로드 받거나 크롬 익스텐션인 Easy Scraper를 활용해 논문의 서지 메타데이터를 크롤링하는 방법에 대해 알아보자. 파이썬의 requests와 beautifulsoup을 활용해 크롤링하는 방법도 알아본다.
2024. 03. 21.
streamlit의 공식 문서는 이미지 갤러리를 만드는 코드가 없다! streamlit의 커뮤니티에서 발견한 이미지 갤러리를 만드는 방법을 공유한다.
2024. 03. 20.
mapbox로 행정구역별 인구 데이터를 시각화해보자. 이 과정에서 geopandas로 행정구역 shp 파일을 읽고, geometry의 crs를 설정하는 방법까지 알아본다.
2024. 02. 27.
판다스로 데이터를 전처리할 때 매번 헷갈리는 코드가 몇가지 있다. 기록용으로 나를 위해 정리해두는 판다스 코드 Tip!
2023. 11. 10.
특정 컬럼의 셀에 리스트로 구성된 값이 있는데, 리스트의 값을 쪼개 여러 행으로 표현해보자. 간단히 explode 함수를 적용해주면 된다.
2023. 04. 07.
건축물대장의 주택가격 txt 파일은 자그마치 26G다. 판다스로 열면, 30분 걸려도 메모리 에러로 안 열리는 파일을 dask로 1초 만에 열린다!
2022. 08. 17.
pymysql로 MySQL에 접속하고, 키워드를 검색해 데이터를 가져오는 과정에서 한글 인코딩 에러가 발생했다. pymysql로 데이터베이스에 접속할 때 인코딩 에러가 나지 않는 방법을 알아보자.
2022. 07. 27.