Голосовые заметки + AI: как я превращаю мысли в задачи за 10 минут
У меня в телефоне лежат 43 голосовые заметки. Некоторым — больше двух месяцев. Там идеи, решения, находки, которые я поймал в машине или на пробежке, и большинство из них я так и не открыл.
Раньше думал, что проблема в привычке. Потом понял: между "наговорил" и "использовал" — пропасть ручной работы. Расшифруй, разбери, оформи. Мозг это блокирует ещё до начала. Сейчас у меня другой процесс, и пропасти нет.
В этой статье: почему голосовые заметки — лучший формат для захвата идей фаундера, почему они же накапливаются мёртвым грузом, и как за 10 минут превращать поток мыслей в задачи, черновики и структурированные документы через ИИ.
Почему голосовые заметки лучше текста
Попробуйте прямо сейчас: откройте заметки и напечатайте идею, которая крутится в голове. Потом откройте диктофон и проговорите её вслух.
Скорость — в три-четыре раза выше. Но важнее другое: когда говоришь, мысль не прерывается. Пальцы на клавиатуре создают паузы, мозг начинает редактировать на ходу, голос идёт за мышлением, а не останавливает его.
Фаундеры думают не линейно. Мысль приходит, тянет за собой следующую, потом третью — и в этом потоке часто рождается самое ценное. Текстовая заметка убивает этот поток, голосовая его сохраняет.
Исследование Microsoft Research: люди говорят со скоростью 150 слов в минуту, а печатают — 40. Для коротких задач разница незаметна, для потока идей — огромна.
Проблема: заметки накапливаются
Большинство голосовых заметок не работают не потому что в них нет ценности — слушать самого себя почти всегда долго и неудобно.
Вы наговорили 5 минут. Там есть 3 хорошие идеи и 4 минуты воды, оговорок, "э-э-э" и "ну вот". Чтобы добраться до идей, надо прослушать всё, мозг этого избегает. Папка заметок растёт, открываешь её всё реже.
ИИ решает именно эту часть: читает транскрипт за секунды, игнорирует воду, выдаёт только нужное.
Стек: три инструмента, ноль лишнего
Запись — встроенный диктофон на iPhone или голосовое сообщение в Telegram себе. Ничего устанавливать не нужно.
Транскрибация — два варианта. Первый: загрузить аудио напрямую в Claude, он транскрибирует и сразу обрабатывает в одном шаге — удобно для заметок до 5 минут. Второй: для длинных файлов (15+ минут) использую MacWhisper — локальная модель Whisper, работает быстро, транскрипт выходит чистый, стоит один раз без подписки.
Обработка — Claude. Вставляю транскрипт или загружаю файл и даю один из трёх запросов ниже.
Три режима обработки
Режим 1: извлечь задачи
Самый частый сценарий. Я наговариваю поток мыслей после встречи или во время прогулки — вперемешку идеи, вопросы, что-то сделать, кому написать. Хаос.
Запрос в Claude: "Вот транскрипт голосовой заметки. Выдели все конкретные действия и задачи — то, что нужно сделать. Оформи как список с глаголом в начале каждого пункта."
На выходе — чистый список задач, без воды, без лирики. Копирую в таск-менеджер и всё.
Из 7-минутной заметки после созвона с клиентом у меня вышло 11 задач. Вручную я бы слушал запись минут 15 и записал бы от силы 5 — остальное забыл бы.
Режим 2: структурировать идею
Иногда я наговариваю не задачи, а мысль — концепцию продукта, план, позиционирование. В голосе это звучит хаотично: прыжки туда-сюда, одно и то же с разных сторон, вставки "подожди, ещё важная штука".
Запрос: "Вот транскрипт. Я думал вслух о [теме]. Структурируй это в логичный документ: основная идея, аргументы, открытые вопросы. Не добавляй ничего от себя — только то, что есть в тексте."
Лучше всего работает для стратегических идей. Я наговариваю 10 минут размышлений о том, как выстроить продуктовую линейку — получаю 1 страницу структурированного документа, который уже можно показать партнёру или положить в базу знаний.
Режим 3: написать черновик
Голосовая заметка как основа для поста, письма или раздела в документе.
Запрос: "Вот транскрипт голосовой заметки. Напиши на её основе черновик поста для Telegram — сохрани мой голос и конкретные примеры, убери повторы и оговорки. Структура: наблюдение → проблема → решение → вывод."
Черновик готов. Дальше я его редактирую, убираю что-то, добавляю — но скелет есть, и работа идёт в 5 раз быстрее, чем с чистого листа.
Когда это работает лучше всего
В машине. Когда еду куда-то один, мозг часто начинает думать — о проблеме, о клиенте, о том, что надо сделать. Раньше это всё улетало. Теперь я просто говорю вслух и потом за 5 минут обрабатываю.
На прогулке или тренировке. Физическая активность разгружает операционное мышление, стратегические мысли выходят сами. Телефон в кармане, наушник в ухе — записываю голосом прямо на ходу.
Сразу после важного разговора. Пока всё свежо — 2-3 минуты в машине или в лифте, проговариваю что услышал, что решил, что надо сделать. Это лучше любого CRM-поля "Итоги встречи".
Как это работает у меня на практике
В апреле я ехал на тренировку и 7 минут говорил в диктофон о том, как хочу выстроить контент-стратегию на ближайший месяц. Не пост, не структуру — просто поток мыслей: что болит у аудитории, какие темы закрыть, какие форматы попробовать, что делаю не так сейчас.
Вечером загрузил аудио в Claude, написал: "Транскрибируй и выдели три вещи: темы для постов, мои наблюдения о проблемах аудитории, что я хочу изменить в подаче."
Получил структурированный ответ. В разделе "темы для постов" было 8 конкретных формулировок — в том числе эта статья и ещё одна про работу с базой знаний. Обе написаны из одной 7-минутной заметки.
Общее время работы: сама запись в машине плюс 5 минут вечером на обработку. Если бы я садился писать контент-план с чистого листа — это полтора-два часа минимум, плюс ощущение, что надо "настроиться".
Теперь у меня правило: раз в неделю разбираю голосовые заметки за последние 7 дней. Кладу транскрипты в один файл, загружаю в Claude и прошу сделать сводку задач и идей. Занимает 15 минут. Раньше я на это не находил времени вообще.
Частые вопросы фаундеров
Нужно ли специальное приложение для записи?
Нет. Встроенный диктофон iPhone или Android справляется. Если нужна синхронизация и теги — Otter.ai или голосовые в Telegram себе. Главное начать записывать, а не искать идеальный инструмент.
Claude транскрибирует аудио или только обрабатывает текст?
Можно загрузить аудиофайл напрямую — Claude его транскрибирует и сразу обработает по вашему запросу в один шаг. Для файлов больше 10-15 минут удобнее сначала прогнать через MacWhisper или Whisper API — качество транскрипта выше, особенно при фоновых шумах.
Если я говорю сбивчиво, с оговорками и паузами — ИИ справляется?
Справляется. Оговорки и повторы он игнорирует при обработке, если прямо в запросе написать "убери воду и оговорки, оставь только суть". Транскрипт будет дословный, обработанный результат — чистый.
Работает ли это для технических или сложных тем?
Работает, но здесь важен запрос. Если тема специфичная — добавьте контекст: "Я говорю о [тема], аудитория — [кто], цель — [что нужно на выходе]". Без контекста Claude может интерпретировать слова слишком широко.
Если хотите встроить подобные процессы в свою работу — напишите мне в Telegram. Разберём вашу задачу и выйдем с конкретным планом.
AI-аудит
Автоматизируйте свой бизнес с AI
Напишите «Аудит» в Telegram — разберу ваши процессы и предложу конкретное решение
Написать в Telegram →