GitHub - ILIAHHne63/LLM_course: RAG system for course

FastAPI сервер

Установите зависимости: pip install -r requirements.txt
Поднимите OpenSearch: docker-compose up -d
(Опционально, есть предзагруженные новости в ./data) Если хотите загрузить свежие новости из телеграмма в папку data используйте news_parser.py, вызовите команду python news_parser.py --api-id **** --api-hash **** --channel @minsportrf --limit 2000 --out minsportrf_messages.json для выгрузки свежих новостей канала minsportrf. Получите api-id и api-hash телеграмма через сайт https://my.telegram.org/auth или по туториалу https://tlgrm.ru/docs/api/obtaining_api_id. URL оставьте пустым, в platform напишите other.
(опционально) Укажите переменные окружения:
- DATA_PATH — путь к директории с JSON-файлами (по умолчанию берётся ./data из корня репозитория)
- NEWS_INDEX_NAME — имя индекса OpenSearch
- FORCE_REBUILD_NEWS_INDEX=1 — чтобы принудительно переиндексировать данные при старте сервера
- OPENSEARCH_RETRY_ATTEMPTS / OPENSEARCH_RETRY_DELAY — сколько раз и с каким интервалом API ждёт доступности OpenSearch
- MISTRAL_API_KEY — ключ доступа к Mistral API (см. пример в api_testing.ipynb)
Запустите API: uvicorn app.main:app --reload --host 0.0.0.0 --port 8000

Все переменные можно задать в .env (см. пример в корне репозитория) — сервер автоматически подхватывает этот файл при старте. Логи сохраняются в build/rag_db.log, а каждый ответ API записывается в директорию outputs/.

Эндпоинты:

GET /health — проверка статуса и кол-ва документов в индексе
GET /news/latest?limit=5 — последние новости по дате
GET /news/{id} — получить конкретное сообщение
POST /news/query — поиск по коллекции (LLM решает стратегию, опционально можно задать force_mode=vector|text)

Пример использования

После запуска uvicorn можно выполнить запрос на поиск:

curl -s -X POST http://localhost:8000/news/query \
  -H "Content-Type: application/json" \
  -d '{"query": "Последние новости России", "limit": 3, "force_mode": "vector"}' \
  > /dev/null && python scripts/show_summary.py

Для удобства есть скрипт. Сначала указываете текст, потом количество новостей:

./scripts/query_news.sh "Последние новости России" 5

Пример ответа (усечённый):

{
  "query": "санкции против отрасли",
  "limit": 3,
  "count": 3,
  "results": [
    {
      "id": "2145",
      "date": "2024-05-12T09:47:00",
      "text": "…сообщение из Telegram…",
      "views": 1234,
      "forwards": 56,
      "has_media": false,
      "channel_title": "MyChannel",
      "channel_username": "@mychannel",
      "score": 18.42
    }
  ]
}

scripts/show_summary.py берёт самый свежий файл outputs/answer_YYYYMMDD-HHMMSS.json (или путь, переданный аргументом) и выводит аккуратно отформатированную сводку + топ новостей на терминал.

Как устроена обработка запроса

Принимаем запрос. Пользователь вызывает POST /news/query с текстом вопроса.
LLM формирует стратегию. Агент на базе mistral-large-latest решает, использовать ли SQL, векторный или текстовый поиск и возвращает JSON-план.
Ищем по БД. Согласно плану выполняются SQL/векторные/BM25 запросы к OpenSearch (данные из mychannel_messages.json заранее проиндексированы).
LLM извлекает факты и суммаризирует. Первый прогон агента вытаскивает сырое содержание из найденных сообщений, второй строит итоговую сводку. Оба текста (extracted_information и summary) возвращаются вместе с исходными документами.

Функции модуля:

семантический (векторный) поиск
SQL-like запросы через Elasticsearch SQL endpoint
Ctrl+F (фразовый / полнотекстовый) поиск

Метрики

Метрики нужны для оценки качества двух основных элементов нашей RAG системы, а именно, качества отбора новостей из базы данных по запросу и качества фильтрации оценочных суждений. Для оценки качества отбора новостей, используется relevance_ratio - отношение количества новостей после фильтрации и изначального количества подобранных новостей по запросу. Заметим, что низкие значения этой метрики могут быть связаны и с тем, что запрос очень специфический и на него не нашлось подходящих новостей. Однако, при достаточно общем запросе, эта метрика оценивает качество отбора новостей. Для оценки качества фильтрации оценочных суждений используется предобученая модель https://huggingface.co/GroNLP/mdebertav3-subjectivity-multilingual - модель классификации теста на два класса: субъективный или объективный. Под объективностью новости будем понимать вероятность того, что новость объективна, согласно предсказанию модели. Мы используем несколько метрик, для оценки качества фильтрации оценочных суждений: avg_orig_objectivity - средняя объективность отобранных новостей до фильтрации, avg_filtered_objectivity - средняя объективность фильтрованных новостей. avg_irrelevant_objectivity - средняя объективность отброшенных новостей, ratio_subj_to_obj - доля изначально субъективных новостей, которые были преобразованны в объективные и ratio_obj_to_subj - доля изначально объективных новостей, которые были преобразованны в субъективные.

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
app		app
data		data
rag_db		rag_db
scripts		scripts
.DS_Store		.DS_Store
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
docker-compose.yml		docker-compose.yml
news_parser.py		news_parser.py
requirements.txt		requirements.txt
update.sh		update.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

FastAPI сервер

Пример использования

Как устроена обработка запроса

Метрики

About

Uh oh!

Releases

Packages

Contributors 5

Uh oh!

Languages

ILIAHHne63/LLM_course

Folders and files

Latest commit

History

Repository files navigation

FastAPI сервер

Пример использования

Как устроена обработка запроса

Метрики

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 5

Uh oh!

Languages

Packages