Serverless, WebAssembly (Wasm)

在 AI 日益強調即時性、隱私與低功耗的時代,Edge AI 成為許多企業與開發者的重要佈局。然而模型部署仍面臨平台相容性、執行效能與資源限制等挑戰。本演講將分享如何透過 WebAssembly(Wasm)技術,實現高可攜、可離線運行的 AI 推論模組,並介紹在 MediaPipe + Gemini Nano + WebAssembly 架構下的實測經驗。

本次深入探討 AI 模型如何轉換為適合瀏覽器的輕量型格式,結合向量資料庫與 SLM(Small Language Models)進行本地推論。歡迎對 AI 輕量部署、Web 技術與 Edge Intelligence 有興趣的開發者一同交流與討論。


聽眾收穫:

  • 了解 WebAssembly 在 AI 模型本地推論上的應用場景與優勢
  • 如何將 LLM/SLM 模型轉換並部署於瀏覽器與邊緣裝置
  • 實際掌握 MediaPipe + Gemini Nano + Wasm 的整合技巧與潛在限制
  • 掌握從雲端架構遷移至邊緣部署的技術挑戰與解決策略
講者

莊翔任(Sean)

國泰金融控股公司
資深工程師

在技術領域擁有超過13年的開發經驗,從程式設計師至外商的技術開發經理。從零開始組建並擴展了一個超過10人的團隊,制定了高效的開發框架與模組,並成功領導完成了超過270個軟體專案。目前於國泰金控擔任資深工程師,專注於研究和開發各種新興技術。