# Portability: UNIVERSAL
# Last validated: 2026-05-17
# Next review: 2027-05-17

## ИМЯ ОБРАБОТЧИКА
doc - Указатель документа и полнотекстовый поиск

## ОПИСАНИЕ
Управление индексом документов на основе FTS5 для полнотекстового поиска. Обработчик
индексирует папки и файлы, обеспечивает быстрый поиск в документах и предложениях
Дополнительные функции, такие как обнаружение дубликатов и классификация защиты данных.

Хранение данных: bach.db/tables document_index, document_fts (FTS5)

## ОПЕРАЦИИ

FTS5-INDEX (полнотекстовый поиск):
  index <путь> Индексировать папки рекурсивно
  index <путь> -n Не индексировать папки рекурсивно
  index <файл> Индексировать отдельный файл
  search <запрос> полнотекстовый поиск (FTS5)
  search <запрос> --limit N Ограничить результаты N (по умолчанию: 20)
  status Просмотр статистики индекса
  восстановить индекс ФТС с нуля
  Clear --force Очистить весь индекс (требуется флаг --force)

СКАНИРОВАНИЕ ФАЙЛОВ (folder_scan):
  scan <путь> Просканировать папку и зарегистрировать в БД
  последние [дни] Показать новые документы (по умолчанию: 7 дней)
  папки Показать все зарегистрированные папки и статистику

АНАЛИЗ И ЗАЩИТА ДАННЫХ (INT06):
  dedup <путь> Обнаружение дубликатов в соответствии с SHA256
  dedup <path> --min-size N Учитывать только файлы >= N байт
  dedup <путь> -n Не искать дубликаты рекурсивно
  классифицировать <путь> Сканировать папку на наличие конфиденциальных данных (рейтинг светофора)
  classify <файл> Проверить отдельный файл на предмет защиты данных

ДРУГОЕ:
  help Показать эту справку

## ПРИМЕРЫ

# Индексирование и поиск по папкам
bach doc index ~/Documents
bach doc search "backup strategie"
bach doc search "config" --limit 5

# Перестроение индекса и проверка статуса
bach doc rebuild
bach doc status

# Показ новых файлов и зарегистрированных папок
bach doc recent
bach doc recent 30
bach doc folders

# Дубликаты и защита данных
bach doc dedup ~/Downloads --min-size 1024
bach doc classify ~/Documents
bach doc classify /path/to/file.txt

## ФАЙЛЫ

Реализация:
  Hub/doc.py Класс DocHandler, Dispatcher

Делегированные инструменты:
  инструменты/document_indexer.py индексирование FTS5
  Hub/_services/document/dedup_scanner.py Обнаружение дубликатов
  Hub/_services/document/privacy_classifier.py Классификация конфиденциальности

Интеграция сканера:
  навыки/инструменты/folder_diff_scanner.py Сканирование инвентаризации файлов (операция сканирования)

База данных:
  data/bach.db Файл базы данных SQLite
  data/migrations/doc_001_fts5.sql Миграция схемы 

## СМОТРИ ТАКЖЕ

- bach api (API Python для программного доступа)
-hub/base.py (базовый класс BaseHandler)
- инструменты/document_indexer.py (API DocumentIndexer)
