Fastest and only macOS Dictation app with on-device STT and custom trained AI enhancement model. A local Wispr Flow alternative. ⭐ helps a ton :) Windows & iOS waitlist open. Linux soon.
Рынок распознавания речи крупный и растущий (~$22–24 млрд в 2026, CAGR ~20–22%), готовность платить доказана десятком продуктов по $8–15/мес и до $849 пожизненно. Но адресуемый сегмент «локальная macOS-диктовка» — тонкий срез, и его дефолтная цена сползает к $0 (Handy, Apple Dictation).
ЗАХВАТ35
Главная слабость. Ниша НЕ свободна: VoiceInk, Voibe, Superwhisper, Spokenly, Weesper заняли все ценовые точки; VoiceInk демпингует ($39.99 разово). Ров близок к нулю — все на одних открытых движках (Whisper/Parakeet), легко клонируется. Единственный зачаток рва — закрытая Fluid Intelligence и скорость, но это хрупко.
ДОСТУП45
GPL-3.0 запрещает закрытый проприетарный дериватив: распространяемый форк обязан оставаться GPL с открытым кодом. Легальные пути — закрытые аддоны (как Fluid Intelligence вне GPL-репо), облако, поддержка, dual-license (но мешает 21 контрибьютор без CLA). Bus-factor: владелец-одиночка (not verified), смягчён контрибьюторами. Вложить: notarization Apple, поддержка, маркетинг в перегретой нише.
«Заработать реально на уровне indie-бизнеса через open-core, но топит слабый capture: ниша забита дешёвыми/бесплатными аналогами при почти нулевом рве, а GPL-3.0 связывает руки.»
Рыночный анализ · Обзор
FluidVoice — бесплатное open-source приложение-диктовка для macOS, превращающее речь в текст прямо на устройстве (без облака) и улучшающее результат локальной AI-моделью.
On-device dictation / voice-to-text (STT) утилита для macOSЗРЕЛОСТЬ · РАСТЁТ
Приложение висит в фоне и по глобальному хоткею слушает микрофон, мгновенно транскрибирует речь и вставляет текст в любое активное поле любого приложения через accessibility API. Ключевые слои — быстрая транскрипция (Parakeet «с нулевой задержкой») и закрытый компонент Fluid Intelligence (локальная AI-модель для форматирования, капитализации и постобработки без выхода данных с Mac). Есть Command Mode (голосовое управление Mac) и Write Mode (диктовка/переписывание текста в любом поле). Поддерживает множество моделей: Nemotron, Parakeet, Cohere, Apple Speech, Whisper.
Какую боль решает
Печатать медленнее, чем говорить, а облачные аналоги дороги (~$15/мес) и отправляют голос на чужие серверы. FluidVoice делает всё локально — быстро, приватно и бесплатно.
Сценарии использования
+Быстрая диктовка сообщений/писем/заметок в любом приложении (Write Mode, вставка через accessibility API)
+Голосовое управление Mac: запуск приложений, шорткаты, системные действия (Command Mode)
+Приватная диктовка конфиденциальных данных, которые нельзя отправлять в облако (локальные модели)
+Многоязычная диктовка (Nemotron ~40 языков, Parakeet v3 25 языков, Whisper до 99 языков)
+Работа на Intel Mac через Whisper-модели (с 1.5.1+)
Целевой пользователь
Индивидуальные пользователи macOS (в первую очередь Apple Silicon): знание-работники, программисты, приватность-осознанные пользователи, люди с ограничениями по печати. B2C-инструмент, не корпоративный.
CLI/утилиты, менее «продуктовые», нишевые инструменты вокруг Whisper.
Позиционирование
Сильный догоняющий / со-лидер в нише macOS-нативной диктовки. По звёздам (6049) уже обгоняет прямого нативного конкурента VoiceInk (~4.3k), но проигрывает кроссплатформенному Handy (~20k). Категория многолюдная (десятки OSS-клонов вокруг Whisper/Parakeet), но у FluidVoice есть дифференциаторы (Command Mode, закрытая Fluid Intelligence, заявленная лучшая скорость Parakeet), поэтому это не «ещё один клон».
Облачная кроссплатформенная AI-диктовка — эталон, с которым FluidVoice себя сравнивает («local Wispr Flow alternative»). Только облако: каждая диктовка загружает аудио на AWS, on-device режима нет.
Запущен в 2022, привлёк $81M инвестиций, стал де-факто премиальным вариантом диктовки (оценки приблизительные).
Прочие: Speakmac — разовая лицензия по устройствам; Notta — pay-as-you-go по минутам.
Неизвестно.
Speakmac (1 Mac)$29 one-time
Speakmac (2 Mac)$49 one-time
Notta~$0.09/мин
Текущая монетизация проекта
Прямой монетизации пока нет — только донаты (GitHub Sponsors) + стратегический задел на open-core. Проект под GPLv3, бесплатный. Ключевой момент: Fluid Intelligence — приватный, закрытый компонент («separate, privately maintained local AI runtime»), который автор сознательно держит ВНЕ GPL-репозитория «чтобы устойчиво предлагать ядро бесплатно (это может измениться)». Плюс открыт waitlist на iOS/Windows/Linux и есть homepage altic.dev/fluid — классическая заготовка под будущий платный/облачный продукт. Состояние: между хобби и pre-commercial — инфраструктура для монетизации заложена, но денежный поток ещё не запущен (аналогично раннему VoiceInk, который позже стал брать $39.99).
Коммерческий потенциал
ПОТЕНЦИАЛ · СРЕДНИЙ
На FluidVoice можно заработать по проверенной соседями модели open-core: ядро бесплатно под GPLv3 (доверие + звёзды), деньги — за то, что НЕ в GPL-репо (закрытая Fluid Intelligence, облако/синхронизация, бинарники с авто-апдейтами и поддержкой, премиум iOS/Windows). Реалистичный потолок — indie-бизнес одного разработчика (как VoiceInk/Voibe), не венчурный масштаб (его занял Wispr Flow с $81M).
Спрос и рынок
Широкий рынок распознавания речи ~$22–24 млрд в 2026 с CAGR ~20–22%, но адресуемый сегмент (потребительская локальная macOS-диктовка) узкий и с сильным давлением бесплатных опций (Handy MIT, Apple Dictation).
Ров / защищённость
Практически отсутствует. Открытые движки STT + десятки клонов + бесплатные MIT-конкуренты (Handy) + бесплатная Apple Dictation. Единственный зачаток рва — закрытая Fluid Intelligence и бренд/скорость, но это некрепко и воспроизводимо.
Модели монетизации
+open-core (платные закрытые аддоны вне GPL-репозитория, как Fluid Intelligence)
+one-time лицензия на готовые бинарники с авто-апдейтами и поддержкой (модель VoiceInk, ~$39.99)
+подписка на облачную синхронизацию / премиум-AI-модели
+платные кроссплатформенные версии (iOS/Windows из waitlist)
+GitHub Sponsors / donations как второстепенный канал
Что нужно, чтобы сделать продукт
+Собственно механизм монетизации — сейчас нет платного тира
+Кроссплатформенность (iOS/Windows пока только в waitlist)
+CLA у контрибьюторов для чистого владения правами (нужно для dual-license)
+Возможно Enterprise-фичи (SSO, compliance), которые у конкурентов уже есть
+Юр-обёртка/бренд для платного продукта поверх GPL-ядра
⚖ ЛИЦЕНЗИЯ · МОЖНО ЛИ КОММЕРЦИАЛИЗИРОВАТЬ
GPL-3.0 — свободная для использования, но с ограничениями на закрытые деривативы и SaaS. Коммерческое использование самого приложения разрешено, но взять код FluidVoice, закрыть его и продавать проприетарную версию НЕЛЬЗЯ — производные обязаны оставаться GPL с открытым исходником. Рабочий путь (который автор уже выбрал) — держать платные компоненты ВНЕ GPL-репозитория (закрытая Fluid Intelligence, облако, бинарники). Законно и жизнеспособно, но потолок ниже, чем у MIT/Apache, и dual-licensing затруднён из-за множества контрибьюторов.
Риски и подводные камни
ВЫСОКИЙКОНКУРЕНЦИЯ
Ниша переполнена, ценовое дно сползает к $0 (Handy MIT, Apple Dictation), маржа под давлением; VoiceInk демпингует разовой лицензией $39.99.
ВЫСОКИЙЛИЦЕНЗИЯ
GPL-3.0: нельзя закрывать код и делать проприетарный SaaS/дериватив без раскрытия исходников. 21 контрибьютор = нет чистого владения правами для dual-license без CLA. Ограничивает, но не убивает монетизацию (аддоны/бинарники/облако законны). Лицензия свободная в смысле использования — это НЕ all-rights-reserved.
СРЕДНИЙСЛАБЫЙ РОВ
Нулевой технологический ров: любой может собрать аналог на тех же Whisper/Parakeet.
СРЕДНИЙПРОЧЕЕ
Платформенная привязка к Apple Silicon/macOS 15+, зависимость от политики Apple (notarization, accessibility API); Intel только через Whisper.
СРЕДНИЙЗАВИСИМОСТЬ ОТ АВТОРА
Владелец-одиночка (altic-dev, not verified); частично смягчён 21 контрибьютором.
НИЗКИЙПРОЧЕЕ
Опора на сторонние модели (NVIDIA Parakeet/Nemotron, Cohere, Whisper) — их лицензии и доступность вне контроля автора.
+Цифры звёзд OSS-конкурентов (VoiceInk ~4.3k, Handy ~20k, OpenWhispr 3.7k+) взяты из отдельных упоминаний и не сверены на текущий момент ≥2 независимыми источниками.
+Цены коммерческих продуктов (Wispr Flow $15/$12, Superwhisper $8.49/$84.99/$249.99→$849, VoiceInk $39.99, Voibe $149, Spokenly $9.99, BossAI $9.99/$69.99, Willow $144/год, Weesper €5, MacWhisper €59, Dragon $699–$1700+, Speakmac $29/$49, Notta ~$0.09/мин) взяты как факты из ресёрча и могли устареть/варьироваться по регионам; часть не подтверждена вторым источником.
+Оценка инвестиций Wispr Flow ($81M) и год запуска (2022) — из общих упоминаний, точность приблизительная.
+Размер рынка распознавания речи ($18–24 млрд в 2025–2026, CAGR ~20–22%) взят из двух расходящихся оценок разных аналитических источников — цифры ориентировочные.
+Утверждение, что on-device режима нет у Wispr Flow ни за какие деньги, и что Superwhisper поднял lifetime до $849 — из вторичных упоминаний, не перепроверено первоисточником.
+URL некоторых продуктов (OpenWhispr, VoiceInk-сайт, Speakmac, Notta) реконструированы по названию и могут не совпадать с реальными доменами.
+Статус монетизации FluidVoice (нет платного тира, Fluid Intelligence закрыта) взят из README на момент анализа; мог измениться.
+Оценка earn_score по осям — экспертное суждение аналитика, а не измеренная метрика.
altic-dev/FluidVoice собрал 59 звёзд за окно, тогда как у автора всего 92 подписчиков — эффективная аудитория ≈ 498. Это даёт surprise-индекс 0.0157 (звёзды относительно охвата автора, а не в абсолюте). Удержание форков 0.0% и 6 внешних контрибьюторов отделяют реальный инструмент от разовой вспышки. Акселерация отрицательная — внимание остывает после пика.
Related Findings
RANKS ABOVE 0% OF 1 FINDINGS
NO RELATED FINDINGS
METRICS IN CONTEXT
MEDIAN ACROSS ALL 1 FINDINGS · Δ vs MEDIAN · PERCENTILE = SHARE RANKED BELOW