DevOps、CI/CD、自動化測試、SRE 等高效可靠的工程實踐
在現代雲端基礎設施管理中,我們經常面臨維運的三大痛點:反應式監控(問題發生後才發現)、數據孤島(各種 metrics 缺乏關聯分析)、人工判斷依賴(需要資深工程師經驗才能識別異常模式)。
想像一下,如果你的可觀測性平台能夠像資深 SRE 一樣,不僅能夠即時洞察系統狀態,還能預測未來的潛在問題,甚至自動關聯不同維度的指標異常,這將如何革命性地改變我們的維運方式?
本次演講將深入探討如何運用 PyCaret AutoML 技術,充分釋放 Prometheus metrics 在可觀測性領域的巨大潛能。涵蓋以下核心技術要素:
- 深度挖掘 Prometheus metrics 的預測價值:
- AutoML 驅動的智能預測與異常檢測
- 智能化維運決策與自動化整合
讓我們一起從傳統的被動監控模式,邁向真正的主動預測維運,實現 AIOps 的核心價值!
聽眾收穫:
- AIOps:
- 智能運維轉型思維:
- 實戰應用與組織價值:
從 AI 與系統整合設計、AI 工具鏈串接,到 AI 開發工具的實戰應用,本場演講將分享在銀行業內部打造 AI 平台的實務經驗。透過具體案例,我們將探討如何在高度合規與安全要求的金融環境中,引入生成式 AI、模型部署框架與自動化開發流程,讓 AI 能夠真正落地,並融入產品規劃與 DevOps 流程之中。希望能為有志於企業內部推動 AI 工程化的技術人員,帶來可借鏡的實作策略與反思。
聽眾收穫:
希望能透過互相交流一起成長
API 是系統溝通的橋樑,準確與穩定的測試是品質保證的基礎。手動撰寫測試腳本常讓開發者疲於奔命,也使測試無法跟上 API 的變動,成為開發流程中的斷點。
本場分享將展示我們如何透過 OpenAPI 規格文件,運用 AI 或模板引擎,自動產生可執行的 Postman 測試腳本,不僅大幅減少測試撰寫時間,更能確保測試涵蓋與 API 定義一致,達到「測試即文件」的理想狀態。
我們將探討:
聽眾收穫:
介紹Quarto(https://quarto.org)這個MIT開源技術文件製作系統,講解如何使用它來得到"Write one source, presenting every where"的效果,也就是只需要撰寫單份使用Markdown語法超集合的Markdown文件原始檔,就能產出 web page, web slide, Latex, PDF, Microsoft PowerPoint/Word 文件;而文件原始檔用另一個R語言MIT開源套件 Ragnar(https://github.com/tidyverse/ragnar)和LLM大語言AI模型的互相配合,就可以打造自己的RAG知識庫檢索系統。
聽眾收穫:
親愛的軟體開發夥伴們,您是否曾好奇,軟體從無到有,除了程式碼,還有哪些環節確保它穩定又好用?軟體測試,絕非只是等到產品完成才開始的「找 bug」工作!它更像一位默默守護品質的超級英雄,貫穿整個軟體開發生命週期 (SDLC) 的每個階段 。
這不僅僅是一場理論的分享,我們將透過生動的案例與您互動,讓您理解測試的真實價值。無論您是想轉職軟體測試、或是與開發團隊能更好地協作,或是單純對軟體開發流程感到好奇,這堂分享都將為您打開一扇全新的大門!
本次分享內容包含:
SDLC 是什麼? 了解軟體從誕生到維護的完整旅程,以及常見的開發模型(如瀑布式、V 模型、敏捷式)如何影響測試節奏 。
「全集中」測試在 SDLC 中扮演什麼角色? 從需求分析到系統維護,測試無處不在,並為品質把關 。我們將探討「為什麼測試是必要的」 。
各種測試活動大解密! 靜態測試、動態測試、單元測試、系統測試... 我們將介紹測試規劃、分析、設計、實施、執行和完成等階段 。
為何要「左移測試」? 提早發現問題,就像及早治療,能省下大筆金錢和時間 。
如何成為 SDLC 中的「全集中」測試小能手? 建立測試思維,與開發團隊協作,共同打造高品質軟體 。我們將探討測試人員的關鍵技能,例如細心謹慎、溝通能力及技術知識 。
聽眾收穫:
透過本次分享,參與者將能夠:
基礎知識: 理解軟體開發生命週期 (SDLC) 的基本概念,以及循序開發、迭代開發、增量開發等常見模型的特點與差異 。
角色認知: 清楚了解測試活動如何在 SDLC 的不同階段(從需求到維護)中發揮關鍵作用,並理解測試活動範疇、時機、文件、技術、人員角色如何受 SDLC 模型影響 。
核心概念: 掌握測試的基本概念,包括測試目標、測試與除錯的區別、以及七個測試原則的重要性 。
實務應用: 理解靜態測試的價值(如早期發現缺陷、降低成本)及其與動態測試的互補關係 。
思維建立: 認識「測試左移」策略,理解為何提早測試能有效節省時間與成本 。
溝通協作: 體會團隊溝通與協作在軟體品質中的重要性,並了解測試人員如何與開發人員及其他利害關係人共同努力 。
本次分享將以 SDLC 為主軸,從 DevOps 流程的視角出發,探討各階段所面臨的挑戰。隨著 AI 技術的興起,不僅加速了程式開發的效率,也為 DevOps 流程注入了新的可能性。而當 DevOps 與 DevSecOps 遇上 MCP(Model Context Protocol)後,又將帶來哪些實務上的應用與轉變?讓我們一同來看看,如何在日常的開發與維運流程中導入 MCP,協助工程團隊簡化需求理解、降低操作複雜度,進而提升整體工作效率!
聽眾收穫:
此次演講將分享如何將一個開源的 .NET 離散事件模擬 (DES) 程式庫進行容器化,並遷移至 Kubernetes 平台。
我們將探討使用 Kubernetes Job 進行基礎的參數化模擬,並進一步展示如何整合 Argo Workflows 來編排更複雜的、大規模的平行參數掃描實驗。
內容將涵蓋:
參與者將了解如何將特定領域的計算密集型應用「K8s 化」,並認識 Argo Workflows 在自動化與平行處理上的強大潛力,為更多創新應用場景打下基礎。
此演講特別適合從事模擬系統開發、雲端運算、或對工作流自動化有興趣的開發者與架構師。
聽眾收穫:
聽眾將學習如何將非典型的計算密集型應用(如離散事件模擬)容器化,並善用 Kubernetes Job 或 Argo Workflows 進行有效的參數掃描與大規模平行處理。
透過一個開源 .NET 離散事件模擬案例,演講將展示從程式準備、容器化到部署的完整流程,並分享在 Kubernetes 環境下進行批次任務的架構設計、開發實務與效能優化建議。
在面對高頻率的版本更新與大型檔期活動壓力下,LINE 購物團隊持續追求「品質穩定」與「快速交付」的平衡。為達成這個目標,我們導入 Playwright 結合內部自建的 MCP(Multi-Context Platform)測試平台,並加入 AI 輔助,打造一套自動化、智慧化的測試流程,有效提升整體開發與驗證效率。
Playwright 提供跨瀏覽器、多裝置模擬及強大的 selector 檢查機制,使得我們能快速建立並維護關鍵路徑的 E2E 測試流程。而 MCP 架構讓測試部署流程模組化、自動化,不僅能根據不同模組獨立執行測試流程,也支援並行驗證與錯誤彙整,加快 debug 效率。
在這個流程中,我們進一步導入 AI 能力來提升智能化層級。例如,透過 LLM 模型自動解析 Playwright 的報錯訊息、推薦改寫腳本策略,甚至能依據 Confluence 的需求文件,自動初步生成場景測試腳本骨架,讓開發人員能更快速將業務邏輯轉換為測試程式碼。透過 Playwright + MCP + AI 的整合,我們實現了開發與測試協作的敏捷化,也讓品質保證的門檻更低、效率更高。未來,我們期待持續深化這套架構,
聽眾收穫:
傳統測試流程碎片且成本高,難以滿足快速迭代。講題將帶領開發者深入 Model Context Protocol (MCP) 與 Google Agent Development Kit (ADK),示範如何結合 Gemini LLM 架構出「多代理 + 測試案例」一體化流程。我們自研五大指令—— /cases (場景生成)、/codes (POM 代碼生成)、/test (端到端執行)、/comparing (版本差異分析)、/images (視覺回歸)——對應測試設計的五大痛點,將測試策略、代碼產出與執行結果緊密串接。議程將展示 Orchestrator Agent 調度子代理、共享 session.state、Callback 實作失敗重試,以及一鍵部署至 Vertex AI Agent Engine 與 Cloud Run 的流程。參與者可學會將 AI 代理融入 CI/CD,將測試案例開發、維護與報告整合成可觀測、可持續的自動化閉環,大幅提升整體測試設計效率。
聽眾收穫:
在傳統 GitOps 運作架構中,「Single Source of Truth」是一切自動化的核心。然而,一旦該信任來源因人為錯誤或意外情況遭到污染,自動化流程可能無法保障一致性,甚至可能造成系統損壞的風險。
在本場議程中,將會探討並展示 GitOps with Event-Driven Ansible 的應用,由 GitOps 自動化結合事件驅動機制,當新的程式碼 Checked In 時,Event-Driven Ansible 可以檢視內容是否和制訂的原則一致,確保自動化機制能夠依照管理人員希望的方式執行,並且符合制訂的原則內容,而不再因為人為失誤造成自動化機制錯誤的執行,確保不僅降低人為疏失所帶來的錯誤風險,更提升整體運作的穩定性與可控性。
此外,議程中也將分享一個真實案例,說明如何整合 Event-Driven Ansible 與 Grafana Alerting,實現服務故障後的自我修復流程。透過即時監控與自動回應,系統得以迅速恢復至正常狀態,進一步強化地端架構的韌性與自主管理能力。
聽眾收穫: