HUANGCHIHHUNGLeo/claude-real-video — earn potential C

▲РЕПО НЕТ В ОКНЕ 30D. ПОКАЗАН FINDING ИЗ ОКНА 1D (1 day) — РАНГ #691.

FINDING #691 · UNIT ID 1284959612

HUANGCHIHHUNGLeo/claude-real-video

Let Claude (or any LLM) actually watch a video — scene-aware, deduplicated frames + transcript, from a URL or local file. Runs locally, MIT.

[ PYTHON ]ЗАРАБОТОК C · 46/100[ GITHUB ↗ ]

SURPRISE SCORE

0.00

Score Breakdown

SURPRISE0.062

ENGAGEMENT0.20

FRESHNESS1.00

SCORE = SURPRISE × ENGAGEMENT^0.7 × FRESHNESS × VISIBILITY × CONFIDENCE

SURPRISE = WINDOW STARS / DAYS / (AUDIENCE + FLOOR)

1% OF STARS IN ARCHIVE

Growth Telemetry

VELOCITY /D

16.00

ACCEL

0.00

RETENTION

0.0%

PEAK 2026-07-24 · FORK-RETENTION 0.0% · 16 STARS / WINDOW

Author Audience

AUDIENCE

218

FOLLOWERS

OWNER ★

1,862

Engagement Signals

FORKS

151

ISSUE AUTH

PR AUTH

UNIQUE STARGAZERS 16 / 16 (DIVERSITY 1.00)

Потенциал заработка

C46/100

СПРОС78

Деньги в теме есть: смежные рынки AI video analytics/video analytics оцениваются в десятки миллиардов долларов с CAGR около 19–22%, а paid willingness виден у TwelveLabs, Google, AWS, ScreenApp, Fireflies и AssemblyAI. Но ниша CLI для Claude keyframes намного уже общего TAM.

ЗАХВАТ32

Удержать ценность сложно: extract frames + transcript воспроизводимы через ffmpeg, yt-dlp, Whisper/OpenCV; есть OSS-аналоги с большим traction; Gemini/ChatGPT/Claude движутся к native video input. Дифференциация возможна только через workflow, local-first и creator-specific Pro.

ДОСТУП70

MIT разрешает коммерческое использование, форки, закрытые деривативы и SaaS при сохранении notice; Python/PyPI уже есть. Риски — молодой проект, малый bus-factor, ToS/copyright вокруг yt-dlp/cookies и сложности облачного SaaS.

«Топит capture: базовая ценность легко копируется и встраивается в native video platforms.»

Рыночный анализ · Обзор

claude-real-video — локальная Python CLI-библиотека, которая превращает видео из URL или файла в набор важных кадров, transcript и manifest для анализа в Claude, ChatGPT, Gemini или другой LLM.

Multimodal AI tooling / video-to-LLM preprocessing / local keyframe extraction + transcriptionЗРЕЛОСТЬ · РАСТЁТ

ЯЗЫК

Python

ЛИЦЕНЗИЯ

MIT

РЕЕСТР

pypi

РЕЛИЗ

v0.5.2

КОНТРИБЬЮТОРЫ

УСТАНОВКА: pip install claude-real-video

Что делает

Инструмент скачивает или принимает локальное видео, извлекает scene-aware keyframes, удаляет near-duplicates, добавляет transcript из subtitles или Whisper и складывает результат в папку для передачи в LLM. Он помогает модели не только читать текст, но и видеть ключевые визуальные изменения в ролике. Обработка выполняется локально, а пользователь сам решает, какие кадры и текст отправлять в облачную модель.

Какую боль решает

Решает боль, когда LLM не принимает видео напрямую, фактически анализирует только transcript или сэмплирует кадры фиксированно и пропускает важные визуальные изменения.

Сценарии использования

Анализ YouTube, TikTok, Instagram Reels, Loom и других видео через Claude/ChatGPT/Gemini.
Разбор маркетинговых и creator-видео: hook, pricing strategy, визуальные приёмы, pacing.
Обработка bug report-видео и screen recordings для Claude Code или ChatGPT.
Локальная приватная предобработка видео перед выборочной отправкой кадров/текста в LLM.
General-purpose keyframe extraction: scene-change detection + dedup без тяжёлых ML-моделей.

Целевой пользователь

AI power users, разработчики, пользователи Claude Code, создатели контента, маркетологи-аналитики, исследователи, support/product команды с большим количеством Loom и screencast-видео.

Open-source аналоги

bradautomates/claude-videoСИЛЬНЕЕ★ 3,400

Ближе к Claude skill и /watch workflow: скачивает видео, извлекает кадры, транскрибирует и отдаёт Claude; сильнее по GitHub traction и Claude-интеграции, тогда как claude-real-video проще как универсальный локальный CLI/PyPI пакет.

byjlw/video-analyzerСМЕЖНЫЙ★ 1,500

Более полный pipeline video analysis: keyframe extraction, Whisper, vision LLM, локальная работа через Ollama/Llama vision или OpenAI-compatible API; claude-real-video легче и больше про подготовку артефактов для любой LLM.

guimatheus92/mcp-video-analyzerНИШЕВЫЙ★ 0

MCP server для извлечения transcripts, key frames, OCR и metadata из video URLs, ориентирован на Claude/Cursor workflows; значительно слабее по adoption и более нишевый.

Позиционирование

claude-real-video не лидер по GitHub stars: bradautomates/claude-video и byjlw/video-analyzer выглядят сильнее. Его позиция — быстрорастущий нишевый догоняющий: простой local-first PyPI CLI для scene-aware frame dedup + transcript, с хорошим framing под Claude/any LLM и аргументом снижения token-cost.

Коммерческие аналоги

TwelveLabsB2BПО ПОТРЕБЛЕНИЮ

Hosted video understanding API: video search, embeddings, analysis и text generation over video через модели Marengo/Pegasus.

Крупная developer/B2B platform: в собранном анализе указаны $100M Series B 1 июля 2026, ранее $50M Series A и tens of thousands of users; цифры требуют внешней верификации источниками.

Freeup to 10 hours / 600 minutes shared usage

Developer Marengo video indexing$0.042 / minute

Infrastructure$0.0015 / minute / month

Search API$4 / 1000 queries

Pegasus Analyze input video$0.0292 / minute

Output text$0.0075 / 1k tokens

Enterprisecustom

Google Cloud Video Intelligence APIB2BПО ПОТРЕБЛЕНИЮ

Cloud API для video annotations: label detection, shot detection, speech transcription, object tracking, text detection, face/person/logo detection.

Enterprise-grade Google Cloud сервис для B2B/cloud developers; масштаб как отдельного продукта в анализе не подтверждён числом пользователей или выручкой.

Free tier stored videofirst 1000 minutes free

Stored video label detection$0.10 / minute after free tier

Stored video shot detection$0.05 / minute

Stored video speech transcription$0.048 / minute

Stored video object/text/logo detection$0.15 / minute

Stored video face/person detection$0.10 / minute

Streaming video label detection$0.12 / minute

Streaming video shot detection$0.07 / minute

Streaming video explicit content$0.12 / minute

Streaming video object tracking$0.17 / minute

Amazon Rekognition VideoB2BПО ПОТРЕБЛЕНИЮ

AWS API для stored video и streaming video events: labels, moderation, face detection/search, celebrity recognition, text detection, person pathing.

Массовый AWS cloud-сервис для B2B/enterprise клиентов; отдельные usage/user metrics в анализе не подтверждены.

Free tier60 free minutes of video analysis per month for 12 months

Streaming video label detection example$0.00817 / minute in US-East example

Stored video label detection example$0.10 / minute

Stored video shot detection example$0.05 / minute

Stored video content moderation example$0.10 / minute

Face metadata storage$0.00001 / face metadata / month

Azure AI Video IndexerB2BFREEMIUM

Microsoft Azure service для извлечения, ревью, поиска и публикации insights из audio/video: transcription, translation, captions, OCR, labels, keyframes, scene/shot detection, face recognition и др.

Enterprise-heavy Azure продукт; точный масштаб пользователей/выручки в анализе не подтверждён.

Free trial website usersup to 10 hours free indexing

Free trial API usersup to 40 hours free indexing

Paid unlimited accountvia Azure subscription, billed by input file duration and selected audio/video presets

Concrete paid per-minute ratesnot confirmed

Google Gemini API / Gemini video understandingB2B / B2CПО ПОТРЕБЛЕНИЮ

Мультимодальные модели Gemini принимают text, image, video и audio input; есть multimodal embeddings и video generation.

Крупная Google developer platform для startups, developers, enterprise и power users; конкретный масштаб usage в анализе не подтверждён.

Gemini 3.1 Flash-Lite Standard text/image/video input$0.25 / 1M tokens

Gemini 3.1 Flash-Lite Standard audio input$0.50 / 1M tokens

Gemini 3.1 Flash-Lite Standard output$1.50 / 1M tokens

Gemini 3.1 Flash-Lite Batch/Flex text/image/video input$0.125 / 1M tokens

Gemini 3.1 Flash-Lite Batch/Flex output$0.75 / 1M tokens

Gemini 3.1 Pro Preview input up to 200k prompt$2.00 / 1M tokens

Gemini 3.1 Pro Preview input above 200k prompt$4.00 / 1M tokens

Gemini 3.1 Pro Preview output up to 200k prompt$12.00 / 1M tokens

Gemini 3.1 Pro Preview output above 200k prompt$18.00 / 1M tokens

Gemini Embedding 2 video input$12.00 / 1M tokens, noted as $0.00079 / frame

Google AI Studiofree in available regions

AssemblyAIB2BFREEMIUM

Speech-to-text, audio intelligence, content moderation, diarization, PII redaction и LLM Gateway; для видео релевантен как audio/transcript слой.

Developer/B2B speech AI platform; конкретный масштаб пользователей или выручки в анализе не подтверждён.

Free pre-recorded audioup to 185 hours free

Free streaming audioup to 333 hours free

Universal-2 pay-as-you-go$0.15 / hour

Universal-3 Pro pay-as-you-go$0.21 / hour

Speaker diarization add-on$0.02 / hour

Content moderation$0.15 / hour

PII text redaction$0.08 / hour

PII audio redaction$0.05 / hour

ScreenAppB2B / B2CПОДПИСКА

AI recording, transcription, summaries, chat with recordings, video analysis, meeting bot и API access.

Страница заявляет 7,538,724+ users и 2M+ users transforming their recordings; в анализе отмечено расхождение, поэтому это маркетинговые claims, не audited metric.

Free$0 / month, 3 recordings, AI summaries/chat/templates trial

Growth$19 / month billed annually, 600 AI credits/year, unlimited recordings, meeting bot

Business$34 / month billed annually, unlimited AI credits, unlimited transcriptions, video analysis, API access, white label

Enterprisecustom

Fireflies.aiB2BFREEMIUM

AI meeting notes, transcription, summaries, search, AskFred assistant, audio/video upload и video recording.

Сильный meeting intelligence продукт для teams/sales/meetings; конкретный масштаб пользователей или выручки в анализе не подтверждён.

Free$0, unlimited transcription/summaries, 400 mins storage/team, 20 AI credits

Pro annual$10 / seat / month billed annually

Pro monthly display$18 / seat / month

Business annual$19 / seat / month billed annually

Business monthly display$29 / seat / month

Enterprise$39 / seat / month annual only

ChatGPT Business / ChatGPT vision/video featuresB2B / B2CПОДПИСКА

Consumer/business multimodal assistant with vision, uploads, voice with video, image generation and file analysis.

Крупный mainstream AI assistant for individuals, teams and enterprise; конкретные user/revenue metrics в анализе не подтверждены.

ChatGPT Business$25.00 per user per month when billed monthly

Enterprisecustom

Текущая монетизация проекта

Да, по README автор уже монетизирует проект через crv Pro: платное расширение добавляет camera-move classification, editing rhythm, perception timeline, breakdown report и creator/full modes. В README указана one-time founder price $19 и URL https://leoaido.com/crv-pro/. Это выглядит как open-core / paid upgrade: free MIT CLI для keyframes/transcript и paid Pro для deeper video teardown; цена $19 не подтверждена внешним источником в рамках задачи.

Коммерческий потенциал

ПОТЕНЦИАЛ · СРЕДНИЙ

Заработать можно, но не как на обычной библиотеке для keyframes, а как на вертикальном workflow-продукте для creator/video analysis: paid CLI/desktop Pro, creator analytics, team/agency plan или local enterprise package. Если проект останется CLI для кадров, потенциал low-medium; если быстро уйдёт в vertical creator intelligence — medium.

Спрос и рынок

Спрос подтверждается смежными рынками: AI video analytics $12.63B в 2024 → $71.30B к 2033 с CAGR 21.4%; video analytics $12.71B в 2024 → $37.84B к 2030 с CAGR 19.5%; Mordor estimate $12.39B в 2025 → $33.74B к 2030 с CAGR 22.18%. Однако адресуемый рынок claude-real-video как CLI — маленький wedge: LLM users, video creators и local-first AI workflows, а не весь video analytics TAM.

Ров / защищённость

Сейчас рва почти нет: scene-aware dedup frames + transcript легко повторить. Потенциальные рвы — workflow moat в Claude Code/Cursor/Obsidian/Notion, domain moat в creator teardown templates и ad analysis, local privacy moat для regulated users, community moat вокруг examples, playbooks и rubric marketplace.

Модели монетизации

open-core / paid Pro upgrade
paid CLI / desktop Pro
creator analytics product
team / agency subscription
local enterprise / privacy package
paid support and consulting
hosted batch processing / API wrapper

Что нужно, чтобы сделать продукт

GUI или desktop app с drag-and-drop video.
Direct export to Claude/ChatGPT/Gemini и batch queue.
Benchmark fixed FPS vs scene-aware vs Gemini native: token savings, recall of fast cuts, summary quality.
Clear Pro packaging: license activation, docs, free vs Pro comparison, refund/support policy, changelog.
Integrations with Claude Code, Cursor/Windsurf/Cline/MCP, Obsidian, Notion, Google Drive and local LLMs.
Privacy statement, ToS/copyright guidance, dependency disclosures for ffmpeg/yt-dlp/Whisper, enterprise support option.
Moat-building через creator-specific datasets/rubrics, pacing/camera/emotion/music heuristics, templates and workflow memory.

⚖ ЛИЦЕНЗИЯ · МОЖНО ЛИ КОММЕРЦИАЛИЗИРОВАТЬ

MIT — коммерчески благоприятная лицензия. Можно использовать в коммерческих продуктах, модифицировать, форкать, встраивать в закрытый код и строить SaaS/desktop/paid CLI поверх при сохранении copyright notice и текста MIT license. Ограничений уровня GPL/AGPL нет. Основные legal risks связаны не с лицензией проекта, а с контентом пользователей, ToS платформ, cookies/login-gated access и зависимостями.

Риски и подводные камни

ВЫСОКИЙКОНКУРЕНЦИЯ

Platform risk: Gemini, ChatGPT, Claude и другие LLMs могут улучшить native video input так, что preprocessing станет менее нужен; Gemini уже имеет video input/token pricing.

ВЫСОКИЙКОММОДИТИЗАЦИЯ

Базовая функциональность extract frames + transcript легко воспроизводима, а OSS-конкуренты bradautomates/claude-video и byjlw/video-analyzer уже имеют больше traction.

ВЫСОКИЙЮР. СЕРАЯ ЗОНА

URL-download через yt-dlp, cookies и login-gated content может конфликтовать с ToS платформ или правами на контент; для SaaS это особенно серьёзно.

СРЕДНИЙЗАВИСИМОСТЬ ОТ АВТОРА

Владелец — individual user, 8 followers, 3 contributors; проект создан 30 июня 2026, поэтому для бизнеса нужен governance, roadmap и issue discipline.

СРЕДНИЙПРОЧЕЕ

Productization risk: CLI удобен developers, но creator/marketing customers захотят GUI, batch, dashboards, shareable reports, billing and support.

СРЕДНИЙСЛАБЫЙ РОВ

Quality risk: scene detection/dedup могут пропустить subtle visual changes, gestures, micro-expressions или text-on-screen transitions; нужны benchmarks.

СРЕДНИЙПРОЧЕЕ

Dependency risk: ffmpeg, yt-dlp, Whisper, platform extractors and OS-specific installation issues.

СРЕДНИЙПРОЧЕЕ

Pricing risk: one-time $19 founder price из README может быть слишком низкой для sustainable support при росте продукта.

Достоверность разбора

УВЕРЕННОСТЬ · СРЕДНЯЯgpt-5.5 · 2026-07-05 · ОКНО 1D

Оговорки / что не проверено

В рамках этой задачи веб-поиск не выполнялся; все данные структурированы из предоставленного разбора и фактов воронки.
Коммерческие цены и масштабы конкурентов перенесены из собранного разбора; не подтверждались заново и не проверялись ≥2 источниками в этой сессии.
Цена crv Pro $19 взята из README и не подтверждена внешне по странице leoaido.com/crv-pro.
Заявления TwelveLabs про $100M Series B, $50M Series A и tens of thousands of users перенесены из разбора и требуют отдельной верификации источниками.
Заявления ScreenApp про 7,538,724+ users и 2M+ users противоречат друг другу на уровне собранного разбора; считаются маркетинговыми claims, не audited metric.
Численные per-minute цены Azure AI Video Indexer в разборе не подтверждены; указаны только free trial и общий принцип billing by duration/presets.
Оценки рынков Grand View Research и Mordor Intelligence перенесены из разбора; конкретные URL-источники для этих market-size цифр не были предоставлены в списке источников.
Звёзды OSS-аналогов bradautomates/claude-video, byjlw/video-analyzer и guimatheus92/mcp-video-analyzer взяты из собранного разбора/snapshot, не перепроверялись.
Классификация maturity, moat, risks, earn_score и коммерческие выводы являются аналитической оценкой на основе предоставленных фактов, а не измеренной метрикой.

ИСТОЧНИКИ (26)

https://github.com/HUANGCHIHHUNGLeo/claude-real-video

https://pypi.org/project/claude-real-video/

https://news.ycombinator.com/item?id=48766005

https://leoaido.com/crv-pro/

https://github.com/bradautomates/claude-video

https://github.com/byjlw/video-analyzer

https://github.com/guimatheus92/mcp-video-analyzer

https://www.twelvelabs.io/

https://www.twelvelabs.io/pricing

https://cloud.google.com/video-intelligence

https://cloud.google.com/video-intelligence/pricing

https://aws.amazon.com/rekognition/

https://aws.amazon.com/rekognition/video-features/

https://aws.amazon.com/rekognition/pricing/

https://azure.microsoft.com/en-us/products/ai-video-indexer

https://azure.microsoft.com/en-us/pricing/details/video-indexer/

https://ai.google.dev/gemini-api

https://ai.google.dev/gemini-api/docs/pricing

https://www.assemblyai.com/

https://www.assemblyai.com/pricing

https://screenapp.io/

https://screenapp.io/pricing

https://fireflies.ai/

https://fireflies.ai/pricing

https://openai.com/chatgpt/business/

https://openai.com/chatgpt/pricing/

Why This Is A Finding

HUANGCHIHHUNGLeo/claude-real-video собрал 16 звёзд за окно, тогда как у автора всего 32 подписчиков — эффективная аудитория ≈ 218. Это даёт surprise-индекс 0.062 (звёзды относительно охвата автора, а не в абсолюте). Удержание форков 0.0% и 0 внешних контрибьюторов отделяют реальный инструмент от разовой вспышки. Акселерация положительная — рост ещё не выдохся.

Related Findings

RANKS ABOVE 88% OF 5791 FINDINGS

#01hoainho/img2threejs[ PYTHON ]3.05 #12TryCaspian/caspian-sdk[ PYTHON ]0.89 #14ifixai-ai/iFixAi[ PYTHON ]0.68 #18liaohch3/claude-tap[ PYTHON ]0.51 #22ayghri/i-have-adhd[ PYTHON ]0.46

METRICS IN CONTEXT

MEDIAN ACROSS ALL 5791 FINDINGS · Δ vs MEDIAN · PERCENTILE = SHARE RANKED BELOW

METRICVALUEMEDIANΔ MEDPERCENTILE

SCORE0.020.00+0.01ABOVE 88%

VELOCITY16.009.00+7.00ABOVE 71%

RETENTION0.0%0.0%0.0 PPABOVE 0%

FORKS151474-323ABOVE 30%

SURPRISE0.060.01+0.06ABOVE 88%