DeusData/codebase-memory-mcp — earn potential C

FINDING #03 · UNIT ID 1166102148

DeusData/codebase-memory-mcp

High-performance code intelligence MCP server. Indexes codebases into a persistent knowledge graph — average repo in milliseconds. 158 languages, sub-ms queries, 99% fewer tokens. Single static binary, zero dependencies.

[ C ]ЗАРАБОТОК C · 48/100[ GITHUB ↗ ]

SURPRISE SCORE

0.00

Score Breakdown

SURPRISE0.00314

ENGAGEMENT2.30

FRESHNESS1.35

SCORE = SURPRISE × ENGAGEMENT^0.7 × FRESHNESS × VISIBILITY × CONFIDENCE

SURPRISE = WINDOW STARS / DAYS / (AUDIENCE + FLOOR)

1% OF STARS IN ARCHIVE

Growth Telemetry

VELOCITY /D

12.27

ACCEL

-1.52

RETENTION

9.9%

PEAK 2026-06-27 · FORK-RETENTION 54.5% · 368 STARS / WINDOW

Author Audience

AUDIENCE

3,863

FOLLOWERS

403

OWNER ★

35,155

Engagement Signals

FORKS

2,724

ISSUE AUTH

PR AUTH

UNIQUE STARGAZERS 367 / 368 (DIVERSITY 1.00)

Потенциал заработка

C48/100

СПРОС82

Денег в теме много, рынок быстро растёт (низкие десятки млрд $ сегодня, ~20-27% CAGR). Готовность платить доказана ($200–600/мес на инженера при миксе инструментов). Боль «токены/контекст на больших базах» центральная (Uber исчерпал годовой AI-бюджет за 4 месяца). Минус — конечный покупатель часто хочет продукт «под ключ», а не бэкенд.

ЗАХВАТ34

Слабое звено. Ниша переполнена клонами того же примитива; реальный риск, что Anthropic/OpenAI/Cursor выпустят нативные индексаторы в ближайшие ~6 мес. Ров слабый: технология воспроизводима, MIT позволяет любому вендору взять код. Небольшой плюс — MCP-нейтральность (полезен при переходе между агентами).

ДОСТУП68

Легально чисто: MIT разрешает коммерциализацию, закрытые деривативы и SaaS. Технический барьер высок правильным образом (десятки тыс. строк C, tree-sitter, Hybrid LSP, эмбеддинги — дорого воспроизвести). Минус — bus-factor: проект фактически на одном мейнтейнере; продукту нужны облако, команда, UI-слой.

«Заработать в теории можно, но топит ось capture: примитив легко копируется по MIT, ниша забита клонами, а платформы-гиганты вот-вот встроят это нативно.»

Рыночный анализ · Обзор

Локальный «движок памяти о коде» — MCP-сервер, который заранее строит из репозитория граф знаний (функции, классы, вызовы, HTTP-маршруты), чтобы AI-агент отвечал на вопросы о структуре кода мгновенно и почти без расхода токенов.

Developer tools / code intelligence / AI-agent infrastructure (MCP-серверы)ЗРЕЛОСТЬ · РАСТЁТ

ЯЗЫК

ЛИЦЕНЗИЯ

MIT

РЕЕСТР

none

РЕЛИЗ

v0.8.1

КОНТРИБЬЮТОРЫ

https://deusdata.github.io/codebase-memory-mcp/ ↗

Что делает

Полностью индексирует средний репозиторий за миллисекунды, ядро Linux (28M строк, 75K файлов) — за 3 минуты, и отвечает на структурные запросы менее чем за 1 мс. Парсит 158 языков через tree-sitter и Hybrid LSP, строит персистентный граф знаний. Это не чат-бот, а структурно-аналитический бэкенд: встроенной LLM нет, API-ключ не нужен. Поставляется единым статическим C-бинарём без зависимостей под macOS/Linux/Windows.

Какую боль решает

AI-агенты (Claude Code, Cursor, Codex) разбираются в коде медленно — через grep/read по одному файлу, тратя массу tool-calls и токенов. Либа заменяет десятки grep/read-циклов одним запросом к графу: в бенчмарке 5 структурных запросов заняли ~3 400 токенов против ~412 000 при пофайловом обходе (сокращение ~99%).

Сценарии использования

Анализ влияния изменений: «изменение conn затрагивает 33 функции в 4 файлах, 78 тестов, HIGH-риск» — вручную через grep невозможно
Обзор архитектуры одним вызовом get_architecture (языки, пакеты, точки входа, маршруты, hotspots, границы, слои, кластеры)
Обнаружение мёртвого кода и Cypher-подобные запросы к графу
Кросс-сервисная привязка HTTP/gRPC/GraphQL-маршрутов к местам вызова
3D-визуализация графа кода в браузере (localhost:9749) для навигации по большим системам

Целевой пользователь

Разработчики и команды, активно использующие AI-coding-агенты, особенно на средних и крупных кодовых базах, где токены и число tool-calls реально бьют по кошельку.

Open-source аналоги

colbymchenry/codegraphСИЛЬНЕЕ★ —

Предварительно собранный граф каждого символа, рёбра вызовов и зависимости; агент задаёт один вопрос и получает исходник, пути вызовов и «радиус поражения» изменения. MCP-сервер, мульти-агент, SQLite + FTS5, Node-рантайм в комплекте. На пике ~2 434 звёзд/день.

CodeGraphContext/CodeGraphContextСМЕЖНЫЙ★ —

Индексирует локальный код в граф, но требует внешнюю Neo4j-БД (NEO4J_URI/USERNAME/PASSWORD). Наш плюс — zero-dependency бинарь против требования Neo4j.

sdsrss/code-graph-mcpНИШЕВЫЙ★ —

AST-граф MCP-сервер для Claude Code на Rust: семантический поиск, обход графа вызовов, трассировка HTTP-маршрутов, анализ влияния. Автоиндекс всего 10 языков через tree-sitter (против 158).

Understand-AnythingСИЛЬНЕЕ★ —

«Turn any code into an interactive knowledge graph you can explore and query». На пике ~2 331 звёзд/день. Сильнее по интерактивной визуализации.

tirth8205/code-review-graphСМЕЖНЫЙ★ —

Фокус на код-ревью: «6.8× меньше токенов на ревью и до 49× на ежедневных задачах». Смежная специализация, а не общий движок памяти.

Позиционирование

Сильный догоняющий / со-лидер в переполняющейся нише. Дифференциаторы объективно лучшие: 158 языков против 10-12 у большинства, единый статический C-бинарь без зависимостей (у CodeGraphContext — Neo4j, у codegraph — Node), Hybrid LSP, локальные эмбеддинги без API-ключа, препринт с бенчмарками. Но это не единственная реализация примитива — на GitHub Trending одновременно ≥3 инструмента графа знаний. Скорее «лучший из клонов одного примитива», чем безальтернативный лидер.

Коммерческие аналоги

Sourcegraph Cody / SourcegraphB2BТОЛЬКО ENTERPRISE

Самый близкий аналог — граф кода + AI поверх него. Ключевая сила — глубокий мульти-репозиторный контекст на платформе code-search.

Крупные клиенты уровня Dropbox, Stripe, Canva; 250 000+ репозиториев (по сообщениям источников, требует подтверждения).

Enterprise (Cody)$59/user/мес (годовой контракт, reported)

Платформа~$16 000 старт с AI-кредитами (reported)

Augment CodeB2B / B2CFREEMIUM

Context Engine с глубоким семантическим индексированием кодовой базы; Auggie CLI набрал 51.80% на SWE-bench Pro.

Growth-стадия, инвестиции в adoption.

Dev$0

Individual Pro$50/мес

Enterprisecustom (SSO, audit logs)

GitHub CopilotB2B / B2CFREEMIUM

Автодополнение + агент; Copilot Memory автоматически выводит и хранит информацию о репозитории.

4,7 млн платных подписчиков (75% рост YoY, reported).

Pro$10/мес

Pro+$39/мес

Business$19/seat

Enterprise$39/seat

Cursor (Anysphere)B2B / B2CFREEMIUM

AI-native IDE с индексацией кодовой базы и MCP-поддержкой.

Самый используемый AI-редактор кода в 2026; превысил $2B ARR (reported).

Pro$20/мес

Pro+$60/мес

Ultra$200/мес

Teams$40/seat

TabnineB2BПОДПИСКА

Коммерческий ассистент с локальными и on-prem моделями для комплаенса.

Enterprise-ориентирован.

Code Assistantот $39/user/мес (год)

Agentic Platformот $59/user/мес

JetBrains AIB2B / B2CПОДПИСКА

AI поверх анализатора JetBrains-IDE.

Большая база IDE.

AI Pro€10/мес personal / €20 commercial

AI Ultimate€30 / €60

Amazon Q DeveloperB2BFREEMIUM

AI-ассистент, глубоко интегрированный в AWS.

Часть экосистемы AWS.

Free$0 (50 agentic-чатов/мес)

Pro$19/user/мес

QodoB2BFREEMIUM

Использует индексированный контекст репозитория для повышения качества сигнала в PR-ревью.

Март 2026: Series B на $70 млн под руководством Qumra Capital; клиенты Nvidia, Walmart (reported).

Free/Pro/Enterprisecustom (детали не подтверждены)

Claude Code (Anthropic)B2B / B2CПОДПИСКА

Терминальный агент с глубоким пониманием кода.

Средний расход Claude Code $150–250 на разработчика в месяц, у power-users выше (reported).

Pro$17–20/мес

Max 5x$100/мес

Max 20x$200/мес

WindsurfB2B / B2CFREEMIUM

AI-IDE с индексацией кодовой базы.

Крупная база пользователей.

Pro$15/мес (500 кредитов)

Teams$30/user/мес

Текущая монетизация проекта

По имеющимся данным — нет, это пока чистый open-source без монетизации. Проект прямо позиционируется как open-source MCP-сервер, работает 100% локально, не собирает телеметрию. Нет признаков open-core, платного облака, платной поддержки или заметной программы GitHub Sponsors в найденных источниках. Владелец — Martin Vogel (профиль DeusData). Фактически это амбициозный сольный/малокомандный проект с исследовательским выхлопом (arXiv), но без выстроенной монетизации; bus-factor низкий.

Коммерческий потенциал

ПОТЕНЦИАЛ · СРЕДНИЙ

Зарабатывать не на самом графе (он будет коммодитизирован), а на enterprise-слое вокруг него по модели Sourcegraph: open-core с бесплатным локальным бинарём как воронкой и платным командным/облачным хранилищем графов, кросс-репо-индексом, SSO/audit/RBAC, on-prem/air-gapped-развёртыванием. Именно за кросс-репозиторный контекст на масштабе организации платят.

Спрос и рынок

Спрос подтверждён и деньгами, и болью. Оценки TAM сильно расходятся между аналитиками (брать как диапазон): Mordor — $9,35 млрд (2026) → $29,96 млрд (2031), CAGR 26,23%; Business Research — $9,46 млрд (2026) → $22,2 млрд (2030), CAGR ~23,7%; Grand View (AI code assistants) — $10,3 млрд (2026) → $42,8 млрд (2033), CAGR 22,5%; Research and Markets — $34,58 млрд (2026) → $91,30 млрд (2032, заметно выше). Реалистичный ориентир — низкие десятки млрд $ сегодня с ~20-27% ростом. Сегмент security/compliance code intelligence растёт на ~26,83% CAGR.

Ров / защищённость

Слабый и временный. Технологический ров есть (широта языков, C-производительность, качество верификации бинарей), но не защищён от копирования из-за MIT. Единственный устойчивый ров возможен только в enterprise-слое (данные организации, интеграции, доверие/комплаенс), которого пока нет.

Модели монетизации

Open-core: локальное ядро бесплатно, командный/кросс-репо-сервер и админ-функции — платно
Управляемое облако (hosted индексы + снапшоты для CI и новых клонов)
Платная enterprise-поддержка/SLA + on-prem-лицензии для регулируемых отраслей
GitHub Sponsors / спонсорство вендорами как временный мост (не самостоятельная бизнес-модель)

Что нужно, чтобы сделать продукт

Командный/серверный режим с общим хранилищем графов (сейчас всё локально, что убивает B2B-ценность кросс-репо на масштабе)
Управление доступом, аудит, SSO/RBAC — обязательно для enterprise-закупок
Юридическая обёртка: сущность-владелец, коммерческая лицензия, SLA
Команда — снять bus-factor с одного мейнтейнера
Продуктовое позиционирование для не-технаря/закупщика (сейчас это инженерный инструмент)

⚖ ЛИЦЕНЗИЯ · МОЖНО ЛИ КОММЕРЦИАЛИЗИРОВАТЬ

Лицензия MIT (свободная) — лучший исход для коммерциализации: разрешает коммерческое использование, закрытые (проприетарные) деривативы и SaaS без обязательства раскрывать исходники. Юридических ограничений на построение платного продукта нет. Обратная сторона того же факта — MIT не создаёт рва: любой (включая Sourcegraph, Anthropic, OpenAI, Cursor) вправе взять код и встроить в свой продукт, что напрямую усиливает HIGH-риск capture. Лицензия даёт полную свободу заработать — и ровно такую же свободу конкурентам.

Риски и подводные камни

ВЫСОКИЙАВТОР МОНЕТИЗИРУЕТ САМ

Поглощение платформами: Anthropic, OpenAI и Cursor, вероятно, выпустят собственные нативные индексаторы в ближайшие ~6 месяцев и зажмут отдельные инструменты. (Стратегический риск коммодитизации гигантами.)

ВЫСОКИЙКОНКУРЕНЦИЯ

Переполненность ниши: ≥3 независимые реализации графа знаний о коде на GitHub Trending за одну неделю. Коммодитизация примитива.

ВЫСОКИЙЗАВИСИМОСТЬ ОТ АВТОРА

Фактически один мейнтейнер (DeusData) ведёт roadmap и релизы; продуктовый бизнес требует команды и юрлица. Bus-factor низкий несмотря на 80 контрибьюторов.

СРЕДНИЙПРОЧЕЕ

Качество/доверие: AI-контекст не гарантирует качество ответа — только 29% разработчиков доверяют точности AI (Stack Overflow 2025). Ценность графа зависит от корректности вывода агента.

СРЕДНИЙСЛАБЫЙ РОВ

Отсутствие командного/облачного слоя означает, что монетизируемая ценность пока не построена; конкуренты (Sourcegraph, Augment) уже там.

НИЗКИЙКОММОДИТИЗАЦИЯ

Ценовое давление: бесплатные и дешёвые тиры повсюду, вендоры дают free-тиры и per-seat SaaS дешевле $25/user/мес.

Достоверность разбора

УВЕРЕННОСТЬ · СРЕДНЯЯclaude-opus-4-8 · 2026-07-05 · ОКНО 7D

Оговорки / что не проверено

Звёзды всех OSS-аналогов не удалось зафиксировать точными числами — приведены только темпы (звёзд/день с GitHub Trending); абсолютные значения null.
Цены Sourcegraph Cody ($49–59/user/мес и ~$16 000 старт платформы) источники дают как «reported» — требуют подтверждения у вендора; исторические тиры Cody Pro ($9) и Free закрыты в 2025.
Метрики выручки/пользователей (Cursor $2B ARR, Copilot 4,7 млн подписчиков, Sourcegraph 250 000+ репозиториев / клиенты Dropbox/Stripe/Canva, Qodo Series B $70 млн) взяты из отдельных источников как reported и не перепроверены ≥2 независимыми.
Оценки TAM рынка расходятся в разы между аналитиками (от ~$9 млрд до ~$34 млрд на 2026) — определения рынка разные; использованы как диапазон, а не как единая цифра.
Прогноз «Anthropic/OpenAI/Cursor выпустят нативные индексаторы в ближайшие ~6 месяцев» — экспертное суждение/общее знание, а не подтверждённый факт.
Личность владельца (Martin Vogel / DeusData) и отсутствие монетизации — вывод из общедоступного профиля и сайта проекта; финансовая закрытость проекта не может быть подтверждена исчерпывающе.
Все бенчмарки либы (99% экономии токенов, 158 языков, индексация ядра Linux за 3 мин, 83% answer quality) взяты из README/препринта самого проекта и независимо не верифицированы.
Дата создания репозитория (2026-02-24) и звёзды указаны по данным воронки и приняты как есть; возраст «~4,5 месяца» вычислен относительно последнего push.

ИСТОЧНИКИ (25)

https://github.com/DeusData/codebase-memory-mcp

https://deusdata.github.io/codebase-memory-mcp/

https://arxiv.org/abs/2603.27277

https://github.com/colbymchenry/codegraph

https://github.com/CodeGraphContext/CodeGraphContext

https://github.com/sdsrss/code-graph-mcp

https://sourcegraph.com

https://www.augmentcode.com

https://www.developersdigest.tech

https://github.com/features/copilot

https://cursor.com

https://ijonis.com

https://www.tabnine.com

https://axify.io

https://www.jetbrains.com/ai/

https://aws.amazon.com/q/developer/

https://www.qodo.ai

https://www.anthropic.com/claude-code

https://morphllm.com

https://nxcode.io

https://www.mordorintelligence.com

https://www.thebusinessresearchcompany.com

https://www.grandviewresearch.com

https://www.researchandmarkets.com

https://survey.stackoverflow.co

Why This Is A Finding

DeusData/codebase-memory-mcp собрал 368 звёзд за окно, тогда как у автора всего 403 подписчиков — эффективная аудитория ≈ 3,863. Это даёт surprise-индекс 0.00314 (звёзды относительно охвата автора, а не в абсолюте). Удержание форков 54.5% и 21 внешних контрибьюторов отделяют реальный инструмент от разовой вспышки. Акселерация отрицательная — внимание остывает после пика.

Related Findings

RANKS ABOVE 98% OF 191 FINDINGS

#37colbymchenry/codegraph[ C ]0.00146 #44erincatto/box3d[ C ]0.00137 #55JustVugg/colibri[ C ]0.000968 #137antirez/ds4[ C ]0.000114 #184torvalds/linux[ C ]0.0000042

METRICS IN CONTEXT

MEDIAN ACROSS ALL 191 FINDINGS · Δ vs MEDIAN · PERCENTILE = SHARE RANKED BELOW

METRICVALUEMEDIANΔ MEDPERCENTILE

SCORE0.010.00+0.01ABOVE 98%

VELOCITY12.272.63+9.63ABOVE 98%

RETENTION9.9%12.8%-2.8 PPABOVE 32%

FORKS2,7244,276-1,552ABOVE 38%

SURPRISE0.000.00+0.00ABOVE 95%