企業級 LLM Guardrail 與 Prompt Hardening

2025-10-15 | 14:10 - 14:55

企業級 LLM Guardrail 與 Prompt Hardening

銀行導入生成式 AI 需同時滿足客戶體驗、資安與監理要求。本議程拆解 Prompt Injection、幻覺、敏感資料洩漏、計費濫用四大風險，提出「前置語義模式 → 執行期 Policy Engine → 事後 Audit Trail」的三層 Guardrail 架構。進一步分享 Prompt Hardening 範式（含前綴模板、上下文封裝、反射型驗證），並展示如何透過 Rule-based Filter、情緒分析器與行為沙箱，在不改模型權重的前提下，讓合規與體驗兼得。

大綱

1. 金融場景風險地圖

監理規範、資安法規、PII 群組

2. Guardrail 三層設計

啟動前：語義模式限制
執行期：Policy as Code、沙箱
事後：可追溯 Audit Trail

3. Prompt Hardening 實務

System Prompt 前綴
Context Packer／Delimiter
Output Self-Check

4. 外部合規系統串接

DLP、SIEM、IAM

5. 示範流程

敏感詞觸發 → 即時遮罩 → 日誌回寫

6. 常見誤區與調整建議

「萬用防火牆」迷思
False Positive / Negative 平衡

7. Roadmap 與組織落地

角色分工
文化與流程建立

聽眾收穫：

取得一份可直接引用的「三層 Guardrail」設計框架圖。
學會 Prompt Hardening 三件套：前綴模板、Context Packer、Self-Check。
理解如何將 Guardrail 與 DLP／SIEM／IAM 等既有資安系統整合。

講者

劉岦崱 (Nils)

國泰金控
資深資料科學分析師

我是國泰世華銀行生成式AI研發與部署小組組長Nils，專注於LLM開源技術研究，開發多款原型產品、推動AI產品部署，並在LLM服務上線後持續迭代開發部署最新技術。

講者職經歷簡介：

國泰世華銀行資測部戰情科 AI 小組組長
曾在德國留學並工作七年
曾為知名外商銀行儲備幹部

講者

楊芷琳（Cheryl）

國泰金控
海外 AI 小組 R&D 實習生

現任國泰金控海外 AI 小組 R&D 實習生，參與金融業生成式 AI 解決方案開發；另於台大心理系與 D School 的實驗室擔任研究助理，研究興趣涵蓋將心理學及人機互動（HCI）應用於 AI 開發，透過深入理解人類行為模式，推動更具人性化的技術解決方案。

SPOTLIGHT
科技金融實戰最前線
LEVEL
進階
ROOM
6F F 會議室
LANGUAGE
中文
TAGS
AI 與系統架構設計
RESOURCE
不提供簡報
共筆連結

2025-10-15 | 14:10 - 14:55