Открыто

Vector DB & RAG Developer [Stepik] [Алексей Малышкин]

Тема в разделе "Курсы по программированию", создана пользователем Топикстартер, 1 окт 2025.

Цена: 5990р.-94%
Взнос: 343р.

Основной список: 22 участников

  1. 1 окт 2025
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба

    Складчина: Vector DB & RAG Developer [Stepik] [Алексей Малышкин]

    upload_2025-10-1_23-36-36.png

    Чему вы научитесь:
    • Пояснять, как работают эмбеддинги и к-NN-поиск
    • Разворачивать Qdrant, Weaviate и FAISS локально и в Docker
    • Загружать и хранить миллионы векторов, не теряя производительность
    • Настраивать фильтрацию и гибридный поиск (BM25 + ANN)
    • Реализовывать мультимодальный поиск (текст ↔ изображение) с CLIP
    • Строить RAG-чат-ботов, дополняющих LLM свежими фактами из базы
    • Метриками Recall@K и nDCG измерять качество выдачи
    • Автоматизировать CI/CD пайплайн для поиска с GitHub Actions
    • Оптимизировать индексы под CPU и GPU, выбирая HNSW, IVF или PQ
    • Оценивать, когда выбрать облако (Pinecone, Qdrant Cloud) vs on-prem
    О курсе:

    Vector DB & RAG Developer — практический маршрут от «что такое эмбеддинги?» до production-чат-бота, отвечающего на вопросы из вашей корпоративной базы знаний.

    За несколько недель вы:
    • развернёте Qdrant, Weaviate и FAISS локально и в Docker/Cloud;
    • создадите коллекции на миллионы векторов, подберёте правильный индекс (HNSW, IVF-PQ, ScaNN);
    • настроите гибридный поиск (BM25 + ANN) и мультимодальный поиск с CLIP;
    • подключите базу к LLM (OpenAI/GPT-4o, Mistral, Llama) и реализуете RAG-архитектуру;
    • измерите качество выдачи (Recall@K, nDCG) и построите автоматические тесты;
    • оформите CI/CD пайплайн: тесты → Docker → GitHub Actions → prod;
    • защитите проект от «векторного взрыва» (sharding, фильтры, дедупликация).
    • Итог — готовый репозиторий с API для семантического поиска и RAG-бот, которого можно деплоить на Render, Railway или собственный сервер.
    • Вы можете задать любой вопрос по курсу в телеграмм @alexey_stepik
    Для кого этот курс:
    • ML / Data-инженеры, которым нужен быстрый поиск по embeddings.
    • Backend-разработчики, добавляющие умный поиск или чат-бота в продукт.
    • DS/Analytics-junior — хотите прокачать портфолио проектом на LLM.
    • Техлиды / CTO, выбирающие стек для корпоративного knowledge-base.
    • Стартапы, где «Google-поиск по документам» и RAG-бот экономят поддержку.
    Начальные требования:
    • Запускать скрипт python main.py, ставить пакеты pip install …
    • Переходить между папками (cd), копировать-вставлять команды
    • Склонировать репозиторий git clone … — всё остальное покажем
    Автор Алексей Малышкин
    • Аналитик-разработчик с опытом работы в крупных компаниях.
    • Победитель олимпиад по математике, программированию и анализу данных.
    Цена 5990 руб.
    Скрытая ссылка
     
    2 пользователям это понравилось.
  2. Последние события

    1. NelifeS
      NelifeS участвует.
      5 дек 2025 в 21:55
    2. mrEgoist
      mrEgoist не участвует.
      2 дек 2025 в 12:50
    3. Рыбак
      Рыбак участвует.
      22 ноя 2025
    4. allioha
      allioha участвует.
      22 ноя 2025

    Последние важные события

    1. skladchik.com
      Назначен организатор.
      7 окт 2025
    2. skladchik.com
      Нужен организатор складчины.
      7 окт 2025
    3. skladchik.com
      Назначен организатор.
      2 окт 2025