# Portability: UNIVERSAL
# Last validated: 2026-05-17
# Next review: 2027-05-17

演算子の分類
--------------------
データ処理演算子の完全な分類
ウォッチャー、ツールチェーン、インジェクター、自動化用。

参考: 学習システム分析 (user/_archive/ANALYSE_Lernsysteme_BACH_vs_recludOS.md)


1。検出オペレーター (「感覚」)
-----------------------------------
システムが環境の変化をどのように認識するか。

1.1 ポーリング (定期的なクエリ)
------------------------------------
状態の定期的なチェック。
  - t0 と t1 でディレクトリの内容を比較します。
  - 5分ごとにAPIをポーリング
  - システムメトリクスの Cron ジョブ
BACH: TimeInjector、デーモン チェック、セッション開始スキャン

1.2 イベント ドリブン (プッシュ ベース)
-------------------------------
外部イベントへの反応。
  - ファイル システム イベント (inotify)
  - Webhook (GitHub、Stripe)
  - メッセージキュー (Kafka、RabbitMQ)
バッハ: まだ実装されていません。最初のステップとしてのツールチェーン イベント。

1.3 スナップショットの差分
--------------------
2 つの状態を比較し、偏差を抽出します。
  - ファイルのハッシュを比較する
  - データベースのスナップショットとライブデータの比較
  - 構成のドリフトを検出
BACH: RAG tools/rag/ingest.py (MD5 変更検出)、DirScan


2。分析演算子
---------------------
システムがデータを理解して分類する方法。

2.1 比較
---------------
2 つ以上の値を比較します。
  - ハッシュ比較
  - フィールド A == フィールド B
  - タイムスタンプ t0 < t1

2.2 測定
----------
定量的な特性を決定します。
  - ファイルサイズ
  - レイテンシー
  - CPU使用率
  - 新しいデータ セットの数

2.3 フィルタリング
-----------
ルールを使用してデータを削減します。
  - 10MBを超えるファイルのみ
  - 件名が「請求書」のメールのみ
  - ステータス 200 の API 応答のみ

2.4 分類
------------------
データをカテゴリに分類します。
  - スパムと非スパム
  - ドキュメントの種類を認識します (請求書、契約書、督促状)
  - ログレベル (INFO、WARN、ERROR)
BACH: OCR 分類 (Office Lens)、スキル タイプ

2.5 グループ化
--------------
特性ごとにデータを要約します。
  - サービスごとにログをグループ化する
  - 請求書を月ごとにグループ化する
  - ファイルの種類ごとにファイルをグループ化

2.6 集約
---------------
グループを結合または圧縮します。
  - すべての請求金額の合計
  - 平均CPU負荷
  - フォルダーごとのファイル数

2.7 相関
---------------
データ ポイント間の関係を検出します。
  - ログイベントとリクエストIDをリンクする
  - センサー値 + タイムスタンプ + 位置
  - エラー + 以前のシステム負荷
BACH: 連想メモリ (memory_associations)

2.8 検証
--------------
データがルールを満たしているかどうかを確認します。
  - JSON スキーマの検証
  - IBANチェック
  - 必須フィールドは利用可能ですか?

2.9 正規化
-----------------
データを統一フォーマットに変換します。
  - 日付形式を統一する
  - 大文字と小文字を一致させる
  - 通貨換算


3.変換演算子
-----------------------------
システムがデータを変換する方法。

3.1 抽出
---------------
生データから情報を抽出します。
  - PDFからのOCR
  - テキストからの正規表現
  - API レスポンスからの JSON フィールド
BACH: OCR パイプライン、RAG チャンキング

3.2 変換
------------------
データを別の形式に変換します。
  - CSV -> JSON
  - テキスト -> トークン
  - 画像 -> サムネイル

3.3 強化
----------------------------
データに追加情報を追加します。
  - 地域検索 (IP -> 国)
  - CRMから顧客データを追加
  - AIベースの分類を追加
BACH: RAG Search (セマンティック強化)

3.4 マージ/結合
---------------------------------
複数のデータ ソースを結合します。
  - キーを使用してテーブルを接続する
  - 複数のサービスからのログをマージします
  - 電子メール + CRM エントリを照合します


4。時間関連演算子
--------------------------

4.1 シーケンス
----------------
シーケンスを作成または分析します。
  - タイムスタンプで並べ替え
  - ワークフローステップを次々に実行します
  - イベントのシーケンスを再構築する
BACH: ツールチェーン エンジン (hub/chain.py)、セッション順序

4.2 ウィンドウ処理
---------------------------
データを時間ウィンドウに分割します。
  - 5分間の平均
  - センサー値のローリングウィンドウ
  - ログ分析用のスライディング ウィンドウ


5.制御演算子
----------------------

5.1 デバウンス
--------------
複数の高速イベントを 1 つに結合します。
  - バンドルファイルの変更
  - UIイベントを減らす
  - API リクエストのスロットル

5.2 レート制限
-----------------
何かが発生する頻度を制限します。
  - 最大。 1 分あたり 10 件の API 呼び出し
  - スロットル電子メール通知
BACH: トークン バジェット ゾーン (recludOS の概念)

5.3 再試行戦略
--------------------
エラーが発生した場合の再試行ロジック。
  - 指数関数的バックオフ
  - 固定再試行間隔
  - タイムアウトになるまで再試行します


6。メモリとステート オペレーター
-------------------------------------

6.1 ステートフル処理
------------------------
以前の値が保存されます。
  - 最後のハッシュを記憶する
  - 最新のAPIステータスを保存
  - ステータス付きスライディングウィンドウ
BACH: メモリ システム (全 5 層)、セッション状態

6.2 ステートレス処理
-------------------------
各処理は独立しています。
  - ファイルのハッシュを計算します
  - JSONを検証する
  - 正規表現一致


7。メタオペレーター (高度な抽象化)
-----------------------------------------

7.1 オーケストレーション
-----------------
複数のオペレーターをワークフローに接続します。
  - n8n パイプライン
  - エアフロー DAG
  - Kubernetes CronJobs + ワーカー
BACH: ツールチェーン エンジン (hub/chain.py)、ワークフロー (skills/workflows/)、開発サイクル

7.2 最適化
--------------
データ処理をより効率的にします。
  - キャッシング
  - 並列化
  - インデックス付け

7.3 可観測性
-------------------------------
システム状態を記録および解釈します。
  - ロギング
  - メトリクス
  -トレース
BACH: セッション ログ、タスク統計、デーモン ステータス


8。演算子パターン (組み合わせ)
-------------------------------------
繰り返しタスクの演算子の一般的な組み合わせ。

8.1 スコアリングとランキング パターン (#9)
-----------------------------------
目的: 要素を評価し、並べ替えます。
演算子: 測定、評価、集計、並べ替え。
  - 電子メールを関連性順に並べ替える
  - 「確率計算」に従って文書をランク付けする

8.2 分類パイプライン パターン (#10)
------------------------------------------
目的: データをクラスに分割します。
演算子: 抽出、正規化、分類、検証。
  - 文書の種類 (請求書/契約書/督促状)
  - チケットの優先度 (低/中/高)

8.3 ルールベースのフィルタリング パターン (#11)
---------------------------------------
目的: 固定ルールに基づいて除外します。
演算子: フィルター、検証、除外。
  - ブラックリストに登録された送信者
  - 添付ファイルのないファイルを破棄

8.4 しきい値アラート パターン (#12)
----------------------------------
目的: 制限値を超えた場合にアラームを鳴らします。
演算子: 測定、比較、評価、イベント トリガー。
  - CPU > 80%
  - 5 分間に 10 件を超えるエラー

8.5 異常検出ライト パターン (#13)
------------------------------------------
目的: 異常な値を検出します (単純)。
演算子: 測定、集計、比較、ウィンドウ処理。
  - 値 > 平均 + 係数
  - ファイル数の急激な増加

8.6 重複排除パターン (#14)
--------------------------------
目的: 重複を検出して削除します。
演算子: 比較、グループ化、集計、フィルター。
  - 重複した請求書
  - 重複したメール/ID

8.7 正規化パターン (#15)
-----------------------------------
目的: データを正規形式に変換します。
演算子: 正規化、変換、検証。
  - 名前、アドレス、日付形式の標準化

8.8 ゴールデン レコード パターン (#16)
--------------------------------
目的: データ レコードの「最良の」バージョンを決定します。
演算子: マージ、評価、集計、検証。
  - 複数のシステムからの顧客データ
  - マスター データのメンテナンス

8.9 多段階検証パターン (#17)
-----------------------------------------
目的: 段階的な検証。
演算子: 検証、分類、フィルター。
  - 構文 -> セマンティクス -> ビジネスルール
  - 「ソフト」と「ハード」の不正なデータ セット

8.10 フォールバック解決パターン (#18)
---------------------------------------
目的: エラーが発生した場合の代替パス。
演算子: テスト、再試行、フォールバック、評価。
  - プライマリ API ダウン -> セカンダリ API
  - AI 分類は不確実 -> ルール

8.11 A/B テスト パターン (#19)
-------------------------------
目的: 2 つの戦略を相互にテストします。
演算子: テスト、比較、評価、集計。
  - 2 つの分類モデル
  - メール ルーティング用の 2 つのルール セット

8.12 複数基準の決定パターン (#20)
-------------------------------------------
目的: いくつかの基準に基づく決定。
演算子: 測定、評価、集計、ランキング。
  - コストセンターへの「最適な」割り当て
  - チケットの優先順位付け

8.13 カテゴリ パターンによるルーティング (#21)
---------------------------------------
目的: カテゴリによるルーティング。
演算子: 分類、フィルタリング、ルーティング。
  - 請求書 -> 会計
  - アプリケーション -> HR

8.14 信頼度に基づく処理パターン (#22)
---------------------------------------------
目的: セキュリティ/スコアに応じた動作。
オペレーター: 評価、分類、フィルター。
  - スコア > 0.9 -> 自動予約
  - スコア 0.6-0.9 -> 手動テスト

8.15 漸進的改良パターン (#23)
------------------------------------------
目的: 段階的な改良。
演算子: 分類、強化、変換。
  - 大まかなカテゴリ -> 細かいサブカテゴリ
  - 最初にドキュメント タイプ、次にコンテンツ抽出

8.16 健全性チェック パターン (#24)
--------------------------------
目的: 単純な妥当性チェック。
演算子: テスト、検証、除外。
  - 金額 > 0
  - 日付が将来ではない

8.17 ソース間の整合性パターン (#25)
--------------------------------------------
目的: 別のソースに対してデータをテストします。
演算子: 比較、マージ、検証。
  - 請求金額とERPの比較
  - 顧客番号と CRM

8.18 エラー分類パターン (#26)
----------------------------------------
目的: エラーの種類を分類します。
演算子: 分類、グループ化、集計。
  - ネットワークエラーとデータエラー
  - ユーザー エラーとシステム エラー

8.19 回復戦略パターン (#27)
-------------------------------------
目的: エラーに対する定義された対応。
演算子: テスト、再試行、フォールバック、ロギング。
  - キュー -> デッドレターキュー
  - 手動後処理リスト

8.20 人間参加型パターン (#28)
-------------------------------------
目的: 不確実性がある場合に人間を関与させます。
演算子: 評価、分類、ルーティング。
  - スコアが低すぎる -> 受信箱をレビューする
  - 競合ケース -> リリースプロセス


学習プロセスとの関係
---------------------
オペレータは 3 つのモードすべてのツールセットを形成します:

  (1) 省エネ：ポーリング＋フィルタリング＋取得ルール
  (2) 考える: 関連付け + 分類 + シナリオ
  (3) 統合: 集約 + 正規化 + グループ

認識演算子 = 感覚 (知覚)
分析演算子＝処理（思考）
トランスフォーメーション Op.   = 行為（行動）
メタオペレーター = コントロール (中央執行部)
演算子パターン = 結合された解パターン


関連ヘルプ ファイル
----------------------
  --ヘルプ戦略 分類、評価、除外、テスト
  -- 思考戦略の支援 認知戦略 (チャンキング、パターン認識など)
  --help レトリック 修辞演算子とパターン
