Голосовые заметки + AI: как я превращаю мысли в задачи за 10 минут

У меня в телефоне лежат 43 голосовые заметки. Некоторым — больше двух месяцев. Там идеи, решения, находки, которые я поймал в машине или на пробежке, и большинство из них я так и не открыл.

Раньше думал, что проблема в привычке. Потом понял: между "наговорил" и "использовал" — пропасть ручной работы. Расшифруй, разбери, оформи. Мозг это блокирует ещё до начала. Сейчас у меня другой процесс, и пропасти нет.

В этой статье: почему голосовые заметки — лучший формат для захвата идей фаундера, почему они же накапливаются мёртвым грузом, и как за 10 минут превращать поток мыслей в задачи, черновики и структурированные документы через ИИ.

Почему голосовые заметки лучше текста

Попробуйте прямо сейчас: откройте заметки и напечатайте идею, которая крутится в голове. Потом откройте диктофон и проговорите её вслух.

Скорость — в три-четыре раза выше. Но важнее другое: когда говоришь, мысль не прерывается. Пальцы на клавиатуре создают паузы, мозг начинает редактировать на ходу, голос идёт за мышлением, а не останавливает его.

Фаундеры думают не линейно. Мысль приходит, тянет за собой следующую, потом третью — и в этом потоке часто рождается самое ценное. Текстовая заметка убивает этот поток, голосовая его сохраняет.

Исследование Microsoft Research: люди говорят со скоростью 150 слов в минуту, а печатают — 40. Для коротких задач разница незаметна, для потока идей — огромна.

Проблема: заметки накапливаются

Большинство голосовых заметок не работают не потому что в них нет ценности — слушать самого себя почти всегда долго и неудобно.

Вы наговорили 5 минут. Там есть 3 хорошие идеи и 4 минуты воды, оговорок, "э-э-э" и "ну вот". Чтобы добраться до идей, надо прослушать всё, мозг этого избегает. Папка заметок растёт, открываешь её всё реже.

ИИ решает именно эту часть: читает транскрипт за секунды, игнорирует воду, выдаёт только нужное.

Стек: три инструмента, ноль лишнего

Запись — встроенный диктофон на iPhone или голосовое сообщение в Telegram себе. Ничего устанавливать не нужно.

Транскрибация — два варианта. Первый: загрузить аудио напрямую в Claude, он транскрибирует и сразу обрабатывает в одном шаге — удобно для заметок до 5 минут. Второй: для длинных файлов (15+ минут) использую MacWhisper — локальная модель Whisper, работает быстро, транскрипт выходит чистый, стоит один раз без подписки.

Обработка — Claude. Вставляю транскрипт или загружаю файл и даю один из трёх запросов ниже.

Три режима обработки

Режим 1: извлечь задачи

Самый частый сценарий. Я наговариваю поток мыслей после встречи или во время прогулки — вперемешку идеи, вопросы, что-то сделать, кому написать. Хаос.

Запрос в Claude: "Вот транскрипт голосовой заметки. Выдели все конкретные действия и задачи — то, что нужно сделать. Оформи как список с глаголом в начале каждого пункта."

На выходе — чистый список задач, без воды, без лирики. Копирую в таск-менеджер и всё.

Из 7-минутной заметки после созвона с клиентом у меня вышло 11 задач. Вручную я бы слушал запись минут 15 и записал бы от силы 5 — остальное забыл бы.

Режим 2: структурировать идею

Иногда я наговариваю не задачи, а мысль — концепцию продукта, план, позиционирование. В голосе это звучит хаотично: прыжки туда-сюда, одно и то же с разных сторон, вставки "подожди, ещё важная штука".

Запрос: "Вот транскрипт. Я думал вслух о [теме]. Структурируй это в логичный документ: основная идея, аргументы, открытые вопросы. Не добавляй ничего от себя — только то, что есть в тексте."

Лучше всего работает для стратегических идей. Я наговариваю 10 минут размышлений о том, как выстроить продуктовую линейку — получаю 1 страницу структурированного документа, который уже можно показать партнёру или положить в базу знаний.

Режим 3: написать черновик

Голосовая заметка как основа для поста, письма или раздела в документе.

Запрос: "Вот транскрипт голосовой заметки. Напиши на её основе черновик поста для Telegram — сохрани мой голос и конкретные примеры, убери повторы и оговорки. Структура: наблюдение → проблема → решение → вывод."

Черновик готов. Дальше я его редактирую, убираю что-то, добавляю — но скелет есть, и работа идёт в 5 раз быстрее, чем с чистого листа.

Когда это работает лучше всего

В машине. Когда еду куда-то один, мозг часто начинает думать — о проблеме, о клиенте, о том, что надо сделать. Раньше это всё улетало. Теперь я просто говорю вслух и потом за 5 минут обрабатываю.

На прогулке или тренировке. Физическая активность разгружает операционное мышление, стратегические мысли выходят сами. Телефон в кармане, наушник в ухе — записываю голосом прямо на ходу.

Сразу после важного разговора. Пока всё свежо — 2-3 минуты в машине или в лифте, проговариваю что услышал, что решил, что надо сделать. Это лучше любого CRM-поля "Итоги встречи".

Как это работает у меня на практике

В апреле я ехал на тренировку и 7 минут говорил в диктофон о том, как хочу выстроить контент-стратегию на ближайший месяц. Не пост, не структуру — просто поток мыслей: что болит у аудитории, какие темы закрыть, какие форматы попробовать, что делаю не так сейчас.

Вечером загрузил аудио в Claude, написал: "Транскрибируй и выдели три вещи: темы для постов, мои наблюдения о проблемах аудитории, что я хочу изменить в подаче."

Получил структурированный ответ. В разделе "темы для постов" было 8 конкретных формулировок — в том числе эта статья и ещё одна про работу с базой знаний. Обе написаны из одной 7-минутной заметки.

Общее время работы: сама запись в машине плюс 5 минут вечером на обработку. Если бы я садился писать контент-план с чистого листа — это полтора-два часа минимум, плюс ощущение, что надо "настроиться".

Теперь у меня правило: раз в неделю разбираю голосовые заметки за последние 7 дней. Кладу транскрипты в один файл, загружаю в Claude и прошу сделать сводку задач и идей. Занимает 15 минут. Раньше я на это не находил времени вообще.

Частые вопросы фаундеров

Нужно ли специальное приложение для записи?

Нет. Встроенный диктофон iPhone или Android справляется. Если нужна синхронизация и теги — Otter.ai или голосовые в Telegram себе. Главное начать записывать, а не искать идеальный инструмент.

Claude транскрибирует аудио или только обрабатывает текст?

Можно загрузить аудиофайл напрямую — Claude его транскрибирует и сразу обработает по вашему запросу в один шаг. Для файлов больше 10-15 минут удобнее сначала прогнать через MacWhisper или Whisper API — качество транскрипта выше, особенно при фоновых шумах.

Если я говорю сбивчиво, с оговорками и паузами — ИИ справляется?

Справляется. Оговорки и повторы он игнорирует при обработке, если прямо в запросе написать "убери воду и оговорки, оставь только суть". Транскрипт будет дословный, обработанный результат — чистый.

Работает ли это для технических или сложных тем?

Работает, но здесь важен запрос. Если тема специфичная — добавьте контекст: "Я говорю о [тема], аудитория — [кто], цель — [что нужно на выходе]". Без контекста Claude может интерпретировать слова слишком широко.

Если хотите встроить подобные процессы в свою работу — напишите мне в Telegram. Разберём вашу задачу и выйдем с конкретным планом.

Написать в Telegram