Logs
Notes
- RAG
- 다국어 임베딩 모델 BAAI/bge-m3 추천
- 벡터DB로 Pinecone과 Milvus 추천
- 엘라스틱서치 임베딩 샘플 코드: embedding_indexing.py
Resources
- 오픈소스 helianthuswhite/chatgpt-web-next NextJS와 Tailwincss로 개발된 ChatGPT 웹 UI
- 옵시디언
- GeekNews
- 파이썬에서의 웹 스크래핑 - 완벽 가이드 | GeekNews
- BeautifulSoup: HTML/XML 파싱, 유연한 탐색 및 검색
- Scrapy: 빠르고 확장 가능, 미들웨어, 분산 크롤링 기능
- Selenium: 브라우저 자동화, 자바스크립트 중심 사이트 처리
- lxml: 매우 빠른 XML/HTML 파서
- pyquery: jQuery 스타일 문법으로 HTML 요소 접근
- 파이썬에서의 웹 스크래핑 - 완벽 가이드 | GeekNews
- 캐글 사이언스 이그잼: Kaggle - LLM Science Exam
- 위키피디아 데이터 RAG 성능 향상 기법 참고
- 도구 앱 연결 링크 만들기: hookmark 현재 리소스에 빠르게 메모를 추가하기.북마크