2024/11/22 2

WIL 7

팀 프로젝트가 시작됐다. 배우는 입장에서 이것저것 다 해보고 싶은 마음이 크다. 그러나 팀원분들과 나와의 배경 지식 차이가 매우 크다는 느낌을 받았다. 내가 이것저것 해본다고 시간을 많이 쓰게 된다면, 그만큼 다른 팀원들의 속도에 따라가지 못하게 된다. 팀 프로젝트를 완성도있게 해내는 것이 궁극적인 목표이기 때문에, 그보다 작은 목표들은 일단은 내려놓아야 겠다는 생각을 했다. 나는 전처리 부분을 꼼꼼히 해보고 싶었다. 그러나 예상치 못하게 데이터 로드하는 부분에서 너무 많은 시간을 써버렸다. 쓸데없는 작업에 몰두해서 하루를 통으로 날린 것이다. 내가 몰두했던 부분은 이미지의 텍스트를 읽어오는 것이었는데, 결국 이 작업은 현업에서도 쉽지 않은 일임을 알게 되었다. 하루를 통으로 날린 기분이지만, 연연하지 ..

TIL 46 팀 프로젝트

팀 프로젝트데이터셋 로드하기1. NotionDirectoryLoader로 노션 파일 읽어오기노션의 API를 활용하는 방법도 있지만, API를 활용하는 방법을 사용하지 않고 싶어서 노션 파일을 html, md, pdf 형식으로 각각 저장해서 읽어오는 방법을 선택했다.from langchain_community.document_loaders.notion import NotionDirectoryLoader위의 코드는 langchain_community 패키지의 document_loaders.notion 모듈에서 NotionDirectoryLoader 클래스를 가져오는 코드다.패키지/라이브러리: langchain_community이 패키지는 LangChain이라는 자연어 처리(NLP) 프레임워크와 관련된 커뮤니..