Как работать с документами
Это руководство объясняет, как пользователь может работать с документами через бота: читать их, извлекать текст, пересказывать, сохранять в базу знаний проекта и потом искать по ним информацию.Что бот умеет
Бот умеет:- читать документы и вытаскивать из них текст;
- распознавать текст на сканах, фотографиях и скриншотах;
- пересказывать содержимое;
- извлекать таблицы и структуру документа в Markdown;
- сохранять распознанный документ в папку проекта в
docs/, чтобы потом использовать его как документацию.
Какие форматы поддерживаются
Бот умеет работать не только с PDF. Поддерживаются документы:- DOCX, DOC
- PPTX, PPT
- XLSX
- CSV
- TXT
- EPUB
- RTF
- ODT
- XML
- TEX
- IPYNB
- PNG
- JPG, JPEG
- AVIF
- TIFF
- GIF
- HEIC, HEIF
- BMP
- WebP
Как попросить бота поработать с документом
Обычно достаточно отправить файл и написать, что именно вы хотите. Примеры:- «Прочитай этот PDF и кратко перескажи».
- «Извлеки текст из этого документа».
- «Посмотри таблицу в файле и выпиши основные цифры».
- «Прочитай этот скан договора и перечисли ключевые условия».
- «Сохрани этот документ в документацию проекта
sales». - «Распознай этот файл и положи его в
docs/finance».
Что происходит после распознавания
Когда бот читает документ, он превращает его содержимое в Markdown-текст. Это удобно, потому что такой текст:- легче пересказывать;
- удобнее анализировать;
- можно сохранить в
docs/; - потом по нему можно искать информацию через умный поиск по документации.
docs, бот обычно:
- сначала распознаёт документ;
- превращает его в
.md; - сохраняет в
docs/<имя_проекта>/<имя_файла>.md.
docs/ лучше хранить именно текстовые материалы, а не исходные PDF или сканы. Так бот сможет потом нормально искать по ним информацию.
Когда полезно сохранять документ в docs
Сохранять документ в docs особенно полезно, если это:
- спецификация;
- инструкция;
- договор или шаблон;
- коммерческое предложение;
- исследование;
- презентация;
- таблица с данными;
- любая справочная информация, к которой вы будете возвращаться позже.
Что лучше писать в запросе
Лучше всего работает конкретная формулировка. Хорошие примеры:- «Прочитай файл и сделай краткое содержание на русском».
- «Извлеки из документа только финансовые показатели».
- «Найди в договоре сроки оплаты и штрафы».
- «Сохрани эту презентацию в
docs/investи потом кратко опиши её». - «Распознай таблицу из изображения и переведи её в Markdown».
Ограничения, о которых стоит знать
- Файл должен существовать и быть доступен боту.
- Очень большие файлы не обрабатываются: лимит около 50 МБ на один файл.
- Если документ очень длинный, бот может показать в ответе только часть результата.
- Если документ был сохранён в
docs, полный распознанный текст всё равно останется на диске, даже если ответ в чате был сокращён. - Для распознавания документов должен быть настроен OCR-сервис. Если он не настроен, бот сообщит об этом ошибкой.
Что делать, если бот не смог прочитать документ
Обычно причина одна из этих:- формат файла не поддерживается;
- файл слишком большой;
- OCR не настроен;
- файл повреждён или недоступен.
- отправить PDF вместо редкого формата;
- уменьшить размер файла;
- прислать отдельные страницы или изображения;
- попросить сохранить документ в
docs, если хотите работать с результатом позже; - уточнить задачу: например, не «прочитай всё», а «найди в документе раздел про оплату».
Полезные сценарии
1. Быстро прочитать документ
Отправьте файл и напишите: «Кратко перескажи этот документ».2. Достать важные пункты
Отправьте документ и попросите: «Найди основные риски, сроки и обязательства».3. Сохранить в базу знаний проекта
Если хотите, чтобы бот мог вернуться к документу позже, напишите: «Сохрани этот документ вdocs/legal».
4. Обработать скан или фото
Можно отправить фото страницы, скриншот, снимок доски или скан и написать: «Распознай текст на изображении и оформи аккуратно».Итог
Чтобы работать с документами, вам достаточно отправить файл и написать, что нужно сделать: прочитать, пересказать, извлечь данные или сохранить вdocs.
Если документ важен для будущей работы, лучше сразу попросить сохранить его в папку проекта в docs. Тогда бот сможет использовать этот материал позже как часть документации.