Привет, есть .pdf файл на 400+ страниц, необходимо написать скрипт на python 3.11 jupiter notebook, который:
- парсит файл с помощью llama_parse в Markdown
- парсит полученное на ноды c помощью MarkdownElementNodeParser и сохраняет в векторную базу данных mongodb atlas
- использует векторный поиск для поиска релевантных нод, после чего использует полученные ноды в качестве контекста для запроса к LLM
- поддерживать OpenAI и локальные LLM с помощью ollama
- прикрутить gradio
В общем, надо написать классическое RAG приложение.
Просьба откликаться специалистов, которые уже имеют опыт работы с RAG приложениями, знают langchain .
Пожалуйста, в отклике свой ник в ТЕЛЕГРАММЕ и кратко релевантный опыт.
Оплата в рублях\криптой.
Спасибо