銀行級 LLM Guardrail 與 Prompt Hardening

銀行導入生成式 AI 需同時滿足客戶體驗、資安與監理要求。本議程拆解 Prompt Injection、幻覺、敏感資料洩漏、計費濫用四大風險,提出「前置語義模式 → 執行期 Policy Engine → 事後 Audit Trail」的三層 Guardrail 架構。進一步分享 Prompt Hardening 範式(含前綴模板、上下文封裝、反射型驗證),並展示如何透過 Rule-based Filter、情緒分析器與行為沙箱,在不改模型權重的前提下,讓合規與體驗兼得。


大綱

1. 金融場景風險地圖

  • 監理規範、資安法規、PII 群組

2. Guardrail 三層設計

  • 啟動前:語義模式限制
  • 執行期:Policy as Code、沙箱
  • 事後:可追溯 Audit Trail

3. Prompt Hardening 實務

  • System Prompt 前綴
  • Context Packer/Delimiter
  • Output Self-Check

4. 外部合規系統串接

  • DLP、SIEM、IAM

5. 示範流程

  • 敏感詞觸發 → 即時遮罩 → 日誌回寫

6. 常見誤區與調整建議

  • 「萬用防火牆」迷思
  • False Positive / Negative 平衡

7. Roadmap 與組織落地

  • 角色分工
  • 文化與流程建立


聽眾收穫:

  • 取得一份可直接引用的「三層 Guardrail」設計框架圖。
  • 學會 Prompt Hardening 三件套:前綴模板、Context Packer、Self-Check。
  • 理解如何將 Guardrail 與 DLP/SIEM/IAM 等既有資安系統整合。
講者

劉岦崱 (Nils)

國泰金控
資深資料科學分析師

我是國泰世華銀行生成式AI研發與部署小組組長Nils,專注於LLM開源技術研究,開發多款原型產品、推動AI產品部署,並在LLM服務上線後持續迭代開發部署最新技術。

講者職經歷簡介:

  • 國泰世華銀行資測部戰情科 AI 小組組長
  • 曾在德國留學並工作七年
  • 曾為知名外商銀行儲備幹部
講者

楊芷琳(Cheryl)

國泰金控
海外 AI 小組 R&D 實習生

現任國泰金控海外 AI 小組 R&D 實習生,參與金融業生成式 AI 解決方案開發;另於台大心理系與 D School 的實驗室擔任研究助理,研究興趣涵蓋將心理學及人機互動(HCI)應用於 AI 開發,透過深入理解人類行為模式,推動更具人性化的技術解決方案。