銀行級 LLM Guardrail 與 Prompt Hardening
銀行導入生成式 AI 需同時滿足客戶體驗、資安與監理要求。本議程拆解 Prompt Injection、幻覺、敏感資料洩漏、計費濫用四大風險,提出「前置語義模式 → 執行期 Policy Engine → 事後 Audit Trail」的三層 Guardrail 架構。進一步分享 Prompt Hardening 範式(含前綴模板、上下文封裝、反射型驗證),並展示如何透過 Rule-based Filter、情緒分析器與行為沙箱,在不改模型權重的前提下,讓合規與體驗兼得。
大綱
1. 金融場景風險地圖
- 監理規範、資安法規、PII 群組
2. Guardrail 三層設計
- 啟動前:語義模式限制
- 執行期:Policy as Code、沙箱
- 事後:可追溯 Audit Trail
3. Prompt Hardening 實務
- System Prompt 前綴
- Context Packer/Delimiter
- Output Self-Check
4. 外部合規系統串接
- DLP、SIEM、IAM
5. 示範流程
- 敏感詞觸發 → 即時遮罩 → 日誌回寫
6. 常見誤區與調整建議
- 「萬用防火牆」迷思
- False Positive / Negative 平衡
7. Roadmap 與組織落地
- 角色分工
- 文化與流程建立
聽眾收穫:
- 取得一份可直接引用的「三層 Guardrail」設計框架圖。
- 學會 Prompt Hardening 三件套:前綴模板、Context Packer、Self-Check。
- 理解如何將 Guardrail 與 DLP/SIEM/IAM 等既有資安系統整合。

講者
劉岦崱 (Nils)
國泰金控
資深資料科學分析師
我是國泰世華銀行生成式AI研發與部署小組組長Nils,專注於LLM開源技術研究,開發多款原型產品、推動AI產品部署,並在LLM服務上線後持續迭代開發部署最新技術。
講者職經歷簡介:
- 國泰世華銀行資測部戰情科 AI 小組組長
- 曾在德國留學並工作七年
- 曾為知名外商銀行儲備幹部

講者
楊芷琳(Cheryl)
國泰金控
海外 AI 小組 R&D 實習生
現任國泰金控海外 AI 小組 R&D 實習生,參與金融業生成式 AI 解決方案開發;另於台大心理系與 D School 的實驗室擔任研究助理,研究興趣涵蓋將心理學及人機互動(HCI)應用於 AI 開發,透過深入理解人類行為模式,推動更具人性化的技術解決方案。