Github Trends®
findingsmedian surprise window 30 days
UNIT / TREND-MONITOR · REV 2.6
[ 30 days window ]
SOURCE: gharchive
FINDING #06 · UNIT ID 1284959612
HUANGCHIHHUNGLeo/claude-real-video
Let Claude (or any LLM) actually watch a video — scene-aware, deduplicated frames + transcript, from a URL or local file. Runs locally, MIT.
[ PYTHON ]ЗАРАБОТОК C · 46/100[ GITHUB ↗ ]
SURPRISE SCORE
0.00

Score Breakdown

SURPRISE0.0783
ENGAGEMENT0.70
FRESHNESS1.00
SCORE = SURPRISE × ENGAGEMENT^0.7 × FRESHNESS × VISIBILITY × CONFIDENCE
SURPRISE = WINDOW STARS / DAYS / (AUDIENCE + FLOOR)
1% OF STARS IN ARCHIVE

Growth Telemetry

VELOCITY /D
8.00
ACCEL
0.00
RETENTION
0.0%
PEAK 2026-07-04 · FORK-RETENTION 0.0% · 8 STARS / WINDOW

Author Audience

AUDIENCE
62
FOLLOWERS
8
OWNER ★
542

Engagement Signals

FORKS
34
ISSUE AUTH
0
PR AUTH
0
UNIQUE STARGAZERS 8 / 8 (DIVERSITY 1.00)

Потенциал заработка

C46/100
СПРОС78
Деньги в теме есть: смежные рынки AI video analytics/video analytics оцениваются в десятки миллиардов долларов с CAGR около 19–22%, а paid willingness виден у TwelveLabs, Google, AWS, ScreenApp, Fireflies и AssemblyAI. Но ниша CLI для Claude keyframes намного уже общего TAM.
ЗАХВАТ32
Удержать ценность сложно: extract frames + transcript воспроизводимы через ffmpeg, yt-dlp, Whisper/OpenCV; есть OSS-аналоги с большим traction; Gemini/ChatGPT/Claude движутся к native video input. Дифференциация возможна только через workflow, local-first и creator-specific Pro.
ДОСТУП70
MIT разрешает коммерческое использование, форки, закрытые деривативы и SaaS при сохранении notice; Python/PyPI уже есть. Риски — молодой проект, малый bus-factor, ToS/copyright вокруг yt-dlp/cookies и сложности облачного SaaS.
«Топит capture: базовая ценность легко копируется и встраивается в native video platforms.»

Рыночный анализ · Обзор

claude-real-video — локальная Python CLI-библиотека, которая превращает видео из URL или файла в набор важных кадров, transcript и manifest для анализа в Claude, ChatGPT, Gemini или другой LLM.
Multimodal AI tooling / video-to-LLM preprocessing / local keyframe extraction + transcriptionЗРЕЛОСТЬ · РАСТЁТ
ЯЗЫК
Python
ЛИЦЕНЗИЯ
MIT
РЕЕСТР
pypi
РЕЛИЗ
v0.5.2
КОНТРИБЬЮТОРЫ
3
УСТАНОВКА: pip install claude-real-video
Что делает

Инструмент скачивает или принимает локальное видео, извлекает scene-aware keyframes, удаляет near-duplicates, добавляет transcript из subtitles или Whisper и складывает результат в папку для передачи в LLM. Он помогает модели не только читать текст, но и видеть ключевые визуальные изменения в ролике. Обработка выполняется локально, а пользователь сам решает, какие кадры и текст отправлять в облачную модель.

Какую боль решает

Решает боль, когда LLM не принимает видео напрямую, фактически анализирует только transcript или сэмплирует кадры фиксированно и пропускает важные визуальные изменения.

Сценарии использования
  • Анализ YouTube, TikTok, Instagram Reels, Loom и других видео через Claude/ChatGPT/Gemini.
  • Разбор маркетинговых и creator-видео: hook, pricing strategy, визуальные приёмы, pacing.
  • Обработка bug report-видео и screen recordings для Claude Code или ChatGPT.
  • Локальная приватная предобработка видео перед выборочной отправкой кадров/текста в LLM.
  • General-purpose keyframe extraction: scene-change detection + dedup без тяжёлых ML-моделей.
Целевой пользователь

AI power users, разработчики, пользователи Claude Code, создатели контента, маркетологи-аналитики, исследователи, support/product команды с большим количеством Loom и screencast-видео.

Open-source аналоги

bradautomates/claude-videoСИЛЬНЕЕ3,400
Ближе к Claude skill и /watch workflow: скачивает видео, извлекает кадры, транскрибирует и отдаёт Claude; сильнее по GitHub traction и Claude-интеграции, тогда как claude-real-video проще как универсальный локальный CLI/PyPI пакет.
byjlw/video-analyzerСМЕЖНЫЙ1,500
Более полный pipeline video analysis: keyframe extraction, Whisper, vision LLM, локальная работа через Ollama/Llama vision или OpenAI-compatible API; claude-real-video легче и больше про подготовку артефактов для любой LLM.
MCP server для извлечения transcripts, key frames, OCR и metadata из video URLs, ориентирован на Claude/Cursor workflows; значительно слабее по adoption и более нишевый.
Позиционирование

claude-real-video не лидер по GitHub stars: bradautomates/claude-video и byjlw/video-analyzer выглядят сильнее. Его позиция — быстрорастущий нишевый догоняющий: простой local-first PyPI CLI для scene-aware frame dedup + transcript, с хорошим framing под Claude/any LLM и аргументом снижения token-cost.

Коммерческие аналоги

TwelveLabsB2BПО ПОТРЕБЛЕНИЮ
Hosted video understanding API: video search, embeddings, analysis и text generation over video через модели Marengo/Pegasus.
Крупная developer/B2B platform: в собранном анализе указаны $100M Series B 1 июля 2026, ранее $50M Series A и tens of thousands of users; цифры требуют внешней верификации источниками.
Freeup to 10 hours / 600 minutes shared usage
Developer Marengo video indexing$0.042 / minute
Infrastructure$0.0015 / minute / month
Search API$4 / 1000 queries
Pegasus Analyze input video$0.0292 / minute
Output text$0.0075 / 1k tokens
Enterprisecustom
Google Cloud Video Intelligence APIB2BПО ПОТРЕБЛЕНИЮ
Cloud API для video annotations: label detection, shot detection, speech transcription, object tracking, text detection, face/person/logo detection.
Enterprise-grade Google Cloud сервис для B2B/cloud developers; масштаб как отдельного продукта в анализе не подтверждён числом пользователей или выручкой.
Free tier stored videofirst 1000 minutes free
Stored video label detection$0.10 / minute after free tier
Stored video shot detection$0.05 / minute
Stored video speech transcription$0.048 / minute
Stored video object/text/logo detection$0.15 / minute
Stored video face/person detection$0.10 / minute
Streaming video label detection$0.12 / minute
Streaming video shot detection$0.07 / minute
Streaming video explicit content$0.12 / minute
Streaming video object tracking$0.17 / minute
Amazon Rekognition VideoB2BПО ПОТРЕБЛЕНИЮ
AWS API для stored video и streaming video events: labels, moderation, face detection/search, celebrity recognition, text detection, person pathing.
Массовый AWS cloud-сервис для B2B/enterprise клиентов; отдельные usage/user metrics в анализе не подтверждены.
Free tier60 free minutes of video analysis per month for 12 months
Streaming video label detection example$0.00817 / minute in US-East example
Stored video label detection example$0.10 / minute
Stored video shot detection example$0.05 / minute
Stored video content moderation example$0.10 / minute
Face metadata storage$0.00001 / face metadata / month
Microsoft Azure service для извлечения, ревью, поиска и публикации insights из audio/video: transcription, translation, captions, OCR, labels, keyframes, scene/shot detection, face recognition и др.
Enterprise-heavy Azure продукт; точный масштаб пользователей/выручки в анализе не подтверждён.
Free trial website usersup to 10 hours free indexing
Free trial API usersup to 40 hours free indexing
Paid unlimited accountvia Azure subscription, billed by input file duration and selected audio/video presets
Concrete paid per-minute ratesnot confirmed
Google Gemini API / Gemini video understandingB2B / B2CПО ПОТРЕБЛЕНИЮ
Мультимодальные модели Gemini принимают text, image, video и audio input; есть multimodal embeddings и video generation.
Крупная Google developer platform для startups, developers, enterprise и power users; конкретный масштаб usage в анализе не подтверждён.
Gemini 3.1 Flash-Lite Standard text/image/video input$0.25 / 1M tokens
Gemini 3.1 Flash-Lite Standard audio input$0.50 / 1M tokens
Gemini 3.1 Flash-Lite Standard output$1.50 / 1M tokens
Gemini 3.1 Flash-Lite Batch/Flex text/image/video input$0.125 / 1M tokens
Gemini 3.1 Flash-Lite Batch/Flex output$0.75 / 1M tokens
Gemini 3.1 Pro Preview input up to 200k prompt$2.00 / 1M tokens
Gemini 3.1 Pro Preview input above 200k prompt$4.00 / 1M tokens
Gemini 3.1 Pro Preview output up to 200k prompt$12.00 / 1M tokens
Gemini 3.1 Pro Preview output above 200k prompt$18.00 / 1M tokens
Gemini Embedding 2 video input$12.00 / 1M tokens, noted as $0.00079 / frame
Google AI Studiofree in available regions
AssemblyAIB2BFREEMIUM
Speech-to-text, audio intelligence, content moderation, diarization, PII redaction и LLM Gateway; для видео релевантен как audio/transcript слой.
Developer/B2B speech AI platform; конкретный масштаб пользователей или выручки в анализе не подтверждён.
Free pre-recorded audioup to 185 hours free
Free streaming audioup to 333 hours free
Universal-2 pay-as-you-go$0.15 / hour
Universal-3 Pro pay-as-you-go$0.21 / hour
Speaker diarization add-on$0.02 / hour
Content moderation$0.15 / hour
PII text redaction$0.08 / hour
PII audio redaction$0.05 / hour
ScreenAppB2B / B2CПОДПИСКА
AI recording, transcription, summaries, chat with recordings, video analysis, meeting bot и API access.
Страница заявляет 7,538,724+ users и 2M+ users transforming their recordings; в анализе отмечено расхождение, поэтому это маркетинговые claims, не audited metric.
Free$0 / month, 3 recordings, AI summaries/chat/templates trial
Growth$19 / month billed annually, 600 AI credits/year, unlimited recordings, meeting bot
Business$34 / month billed annually, unlimited AI credits, unlimited transcriptions, video analysis, API access, white label
Enterprisecustom
Fireflies.aiB2BFREEMIUM
AI meeting notes, transcription, summaries, search, AskFred assistant, audio/video upload и video recording.
Сильный meeting intelligence продукт для teams/sales/meetings; конкретный масштаб пользователей или выручки в анализе не подтверждён.
Free$0, unlimited transcription/summaries, 400 mins storage/team, 20 AI credits
Pro annual$10 / seat / month billed annually
Pro monthly display$18 / seat / month
Business annual$19 / seat / month billed annually
Business monthly display$29 / seat / month
Enterprise$39 / seat / month annual only
Consumer/business multimodal assistant with vision, uploads, voice with video, image generation and file analysis.
Крупный mainstream AI assistant for individuals, teams and enterprise; конкретные user/revenue metrics в анализе не подтверждены.
ChatGPT Business$25.00 per user per month when billed monthly
Enterprisecustom
Текущая монетизация проекта

Да, по README автор уже монетизирует проект через crv Pro: платное расширение добавляет camera-move classification, editing rhythm, perception timeline, breakdown report и creator/full modes. В README указана one-time founder price $19 и URL https://leoaido.com/crv-pro/. Это выглядит как open-core / paid upgrade: free MIT CLI для keyframes/transcript и paid Pro для deeper video teardown; цена $19 не подтверждена внешним источником в рамках задачи.

Коммерческий потенциал

ПОТЕНЦИАЛ · СРЕДНИЙ

Заработать можно, но не как на обычной библиотеке для keyframes, а как на вертикальном workflow-продукте для creator/video analysis: paid CLI/desktop Pro, creator analytics, team/agency plan или local enterprise package. Если проект останется CLI для кадров, потенциал low-medium; если быстро уйдёт в vertical creator intelligence — medium.

Спрос и рынок

Спрос подтверждается смежными рынками: AI video analytics $12.63B в 2024 → $71.30B к 2033 с CAGR 21.4%; video analytics $12.71B в 2024 → $37.84B к 2030 с CAGR 19.5%; Mordor estimate $12.39B в 2025 → $33.74B к 2030 с CAGR 22.18%. Однако адресуемый рынок claude-real-video как CLI — маленький wedge: LLM users, video creators и local-first AI workflows, а не весь video analytics TAM.

Ров / защищённость

Сейчас рва почти нет: scene-aware dedup frames + transcript легко повторить. Потенциальные рвы — workflow moat в Claude Code/Cursor/Obsidian/Notion, domain moat в creator teardown templates и ad analysis, local privacy moat для regulated users, community moat вокруг examples, playbooks и rubric marketplace.

Модели монетизации
  • open-core / paid Pro upgrade
  • paid CLI / desktop Pro
  • creator analytics product
  • team / agency subscription
  • local enterprise / privacy package
  • paid support and consulting
  • hosted batch processing / API wrapper
Что нужно, чтобы сделать продукт
  • GUI или desktop app с drag-and-drop video.
  • Direct export to Claude/ChatGPT/Gemini и batch queue.
  • Benchmark fixed FPS vs scene-aware vs Gemini native: token savings, recall of fast cuts, summary quality.
  • Clear Pro packaging: license activation, docs, free vs Pro comparison, refund/support policy, changelog.
  • Integrations with Claude Code, Cursor/Windsurf/Cline/MCP, Obsidian, Notion, Google Drive and local LLMs.
  • Privacy statement, ToS/copyright guidance, dependency disclosures for ffmpeg/yt-dlp/Whisper, enterprise support option.
  • Moat-building через creator-specific datasets/rubrics, pacing/camera/emotion/music heuristics, templates and workflow memory.
⚖ ЛИЦЕНЗИЯ · МОЖНО ЛИ КОММЕРЦИАЛИЗИРОВАТЬ
MIT — коммерчески благоприятная лицензия. Можно использовать в коммерческих продуктах, модифицировать, форкать, встраивать в закрытый код и строить SaaS/desktop/paid CLI поверх при сохранении copyright notice и текста MIT license. Ограничений уровня GPL/AGPL нет. Основные legal risks связаны не с лицензией проекта, а с контентом пользователей, ToS платформ, cookies/login-gated access и зависимостями.
Риски и подводные камни
ВЫСОКИЙКОНКУРЕНЦИЯ
Platform risk: Gemini, ChatGPT, Claude и другие LLMs могут улучшить native video input так, что preprocessing станет менее нужен; Gemini уже имеет video input/token pricing.
ВЫСОКИЙКОММОДИТИЗАЦИЯ
Базовая функциональность extract frames + transcript легко воспроизводима, а OSS-конкуренты bradautomates/claude-video и byjlw/video-analyzer уже имеют больше traction.
ВЫСОКИЙЮР. СЕРАЯ ЗОНА
URL-download через yt-dlp, cookies и login-gated content может конфликтовать с ToS платформ или правами на контент; для SaaS это особенно серьёзно.
СРЕДНИЙЗАВИСИМОСТЬ ОТ АВТОРА
Владелец — individual user, 8 followers, 3 contributors; проект создан 30 июня 2026, поэтому для бизнеса нужен governance, roadmap и issue discipline.
СРЕДНИЙПРОЧЕЕ
Productization risk: CLI удобен developers, но creator/marketing customers захотят GUI, batch, dashboards, shareable reports, billing and support.
СРЕДНИЙСЛАБЫЙ РОВ
Quality risk: scene detection/dedup могут пропустить subtle visual changes, gestures, micro-expressions или text-on-screen transitions; нужны benchmarks.
СРЕДНИЙПРОЧЕЕ
Dependency risk: ffmpeg, yt-dlp, Whisper, platform extractors and OS-specific installation issues.
СРЕДНИЙПРОЧЕЕ
Pricing risk: one-time $19 founder price из README может быть слишком низкой для sustainable support при росте продукта.

Достоверность разбора

УВЕРЕННОСТЬ · СРЕДНЯЯgpt-5.5 · 2026-07-05 · ОКНО 1D
Оговорки / что не проверено
  • В рамках этой задачи веб-поиск не выполнялся; все данные структурированы из предоставленного разбора и фактов воронки.
  • Коммерческие цены и масштабы конкурентов перенесены из собранного разбора; не подтверждались заново и не проверялись ≥2 источниками в этой сессии.
  • Цена crv Pro $19 взята из README и не подтверждена внешне по странице leoaido.com/crv-pro.
  • Заявления TwelveLabs про $100M Series B, $50M Series A и tens of thousands of users перенесены из разбора и требуют отдельной верификации источниками.
  • Заявления ScreenApp про 7,538,724+ users и 2M+ users противоречат друг другу на уровне собранного разбора; считаются маркетинговыми claims, не audited metric.
  • Численные per-minute цены Azure AI Video Indexer в разборе не подтверждены; указаны только free trial и общий принцип billing by duration/presets.
  • Оценки рынков Grand View Research и Mordor Intelligence перенесены из разбора; конкретные URL-источники для этих market-size цифр не были предоставлены в списке источников.
  • Звёзды OSS-аналогов bradautomates/claude-video, byjlw/video-analyzer и guimatheus92/mcp-video-analyzer взяты из собранного разбора/snapshot, не перепроверялись.
  • Классификация maturity, moat, risks, earn_score и коммерческие выводы являются аналитической оценкой на основе предоставленных фактов, а не измеренной метрикой.
ИСТОЧНИКИ (26)

Why This Is A Finding

HUANGCHIHHUNGLeo/claude-real-video собрал 8 звёзд за окно, тогда как у автора всего 8 подписчиков — эффективная аудитория ≈ 62. Это даёт surprise-индекс 0.0783 (звёзды относительно охвата автора, а не в абсолюте). Удержание форков 0.0% и 0 внешних контрибьюторов отделяют реальный инструмент от разовой вспышки. Акселерация положительная — рост ещё не выдохся.

Related Findings

RANKS ABOVE 0% OF 1 FINDINGS
NO RELATED FINDINGS

METRICS IN CONTEXT

MEDIAN ACROSS ALL 1 FINDINGS · Δ vs MEDIAN · PERCENTILE = SHARE RANKED BELOW
METRICVALUEMEDIANΔ MEDPERCENTILE
SCORE0.030.030.00ABOVE 0%
VELOCITY8.008.000.00ABOVE 0%
RETENTION0.0%0.0%0.0 PPABOVE 0%
FORKS34340ABOVE 0%
SURPRISE0.080.080.00ABOVE 0%