Projects
AI platform · Agent design · RAG · Realtime AI
BloomRender
以 Google Gemini API 驅動的 AI 照片編輯與生成工作室:修圖、濾鏡、證件照、形象照、旅遊照、主題寫真、團體照與虛擬試穿。
綜合物業管理系統
以 React + TypeScript + Tailwind CSS 打造的單機/雲端雙模式物業管理系統,涵蓋承租人、物件、合約、報修、資產與潛在客戶管理,支援 LocalStorage 與 Google Sheets 同步。
即時語音 AI
OpenAI Realtime API + Gemini Live + MCP:可選模型的類 ChatGPT 語音助理,支援即時語音、串流回覆、深色/淺色模式與工具增強對話。
Square Couplets Master
使用 Google Gemini AI 將願望關鍵字轉為傳統春聯斗方藝術作品,支援參考圖片風格、多種解析度(1K/2K/4K)與三種模型(Gemini 2.5 Flash / Gemini 3.1 Flash / Gemini 3 Pro),並提供設定面板與結果預覽介面。
Text2Podcast
從文字內容自動生成專業 Podcast 音訊,以 AI 將文字轉為雙講者對話稿,搭配 Google Cloud TTS 合成自然語音,支援多種長度模式與即時進度追蹤。
PPT2Preview
將投影片與 Markdown 大綱自動轉為帶 AI 語音解說的專業影片,支援 PDF/PPTX 上傳、Gemini 腳本生成、多音色 TTS 與一鍵合成下載。
PDF to Markdown Converter
將 PDF 轉換為 Markdown 的 CLI 或工具,便於文檔結構化、版本控制與後續 RAG/檢索流程使用。
收據 OCR API
以 PaddleOCR + YOLOv7 + 自訂正則化流程,自動解析台灣各大醫院住院/門診收據,輸出 API 友善的 JSON 結構。
Agentic RAG 系統
基於 LangGraph 的多代理 RAG,以 Gemini 多模態解析 PDF、語義分塊與查詢重寫/自我校正,提供 REST 與 MCP API,支援 Docker 與 Cloud Run 部署。
LINE Chatbot · n8n 工作流平台
基於 n8n 建構的 LINE Chatbot,以 Google Gemini 分析用戶輸入並智能路由至 19 個子流程,涵蓋 RAG、事實查證、新聞、圖像生成與網頁爬取。
Looking for an AI platform or Agentic AI partner? Let's take GenAI from PoC to production.
Contact on LinkedIn專案
AI 平台 · Agent 設計 · RAG · 即時 AI
BloomRender
以 Google Gemini API 驅動的 AI 照片編輯與生成工作室:修圖、濾鏡、證件照、形象照、旅遊照、主題寫真、團體照與虛擬試穿。
綜合物業管理系統
以 React + TypeScript + Tailwind CSS 打造的單機/雲端雙模式物業管理系統,涵蓋承租人、物件、合約、報修、資產與潛在客戶管理,支援 LocalStorage 與 Google Sheets 同步。
即時語音 AI
OpenAI Realtime API + Gemini Live + MCP:可選模型的類 ChatGPT 語音助理,支援即時語音、串流回覆、深色/淺色模式與工具增強對話。
Square Couplets Master
使用 Google Gemini AI 將願望關鍵字轉為傳統春聯斗方藝術作品,支援參考圖片風格、多種解析度(1K/2K/4K)與三種模型(Gemini 2.5 Flash / Gemini 3.1 Flash / Gemini 3 Pro),並提供設定面板與結果預覽介面。
Text2Podcast
從文字內容自動生成專業 Podcast 音訊,以 AI 將文字轉為雙講者對話稿,搭配 Google Cloud TTS 合成自然語音,支援多種長度模式與即時進度追蹤。
PPT2Preview
將投影片與 Markdown 大綱自動轉為帶 AI 語音解說的專業影片,支援 PDF/PPTX 上傳、Gemini 腳本生成、多音色 TTS 與一鍵合成下載。
PDF to Markdown Converter
將 PDF 轉換為 Markdown 的 CLI 或工具,便於文檔結構化、版本控制與後續 RAG/檢索流程使用。
收據 OCR API
以 PaddleOCR + YOLOv7 + 自訂正則化流程,自動解析台灣各大醫院住院/門診收據,輸出 API 友善的 JSON 結構。
Agentic RAG 系統
基於 LangGraph 的多代理 RAG,以 Gemini 多模態解析 PDF、語義分塊與查詢重寫/自我校正,提供 REST 與 MCP API,支援 Docker 與 Cloud Run 部署。
LINE Chatbot · n8n 工作流平台
基於 n8n 建構的 LINE Chatbot,以 Google Gemini 分析用戶輸入並智能路由至 19 個子流程,涵蓋 RAG、事實查證、新聞、圖像生成與網頁爬取。
正在尋找 AI 平台或 Agent 落地夥伴?一起把 GenAI 從 PoC 做到上線。
LinkedIn 聯絡