Support #289
closed了解cacafly提供之PoC系統架構
Updated by Mark Chiang about 1 month ago · Edited
- Status changed from New to In Progress
- % Done changed from 0 to 10
Updated by Mark Chiang about 1 month ago · Edited
至於最重要的query
他會先從這裡 呼叫LabelExample取得範例, 教LLM如何從新聞提取哪些重要訊息.
然後呼叫這裡 的 ReadArticle,
在這裡 程式會呼叫LLM 用gemini-flash 從biodnd.news.news_en_sample(儲存新聞的地方)讀新聞
然後把我們有興趣的資料提取出來成為JSON格式.
然後呼叫ParsedResult把他變成sql的結構回傳.
根據這行 CREATE OR REPLACE TABLE `biodnd.news.news_en_sample_test`
就會被放到 biodnd.news.news_en_sample_test
Updated by Mark Chiang about 1 month ago · Edited
- % Done changed from 20 to 30
Updated by Mark Chiang about 1 month ago
- % Done changed from 30 to 40
至於怎麼把 gcs 上面的文章轉成報告
主要是透過 ~/projects/cacafly/geneonline_rag
這一包是 RAG API
跑起來之後就有 API 可以呼叫
呼叫API就可以告訴他你想要把GCS上面的哪些資料寫成報告
寫成報告要用到的prompt在reports.py裡面
rag.py主要是讓你search的時候用的
比如說 你透過API呼叫run.py裡面的/summaryFolder, 它就會呼叫reports.py裡面的summary_folder
然後就會把GCS上面的某個folder裡面的文章都summarize.
Updated by Mark Chiang about 1 month ago · Edited
詳細API可以看下面文件
https://docs.google.com/document/d/1abEyw01cpOJsyE8t18ab57XPSQ0vGLKqbQ3wO23MyDE/edit#heading=h.82ou22o3gzw2
概念上就是 cacafly提供的是api
James 可以透過這個 api 去寫 file managment 的 前端
把檔案放上 gcs, 然後就可以呼叫這個 api 去把檔案弄進 rag 裡面,
然後就可以透過 rag 的 api 去問他.
Updated by Mark Chiang about 1 month ago
- Status changed from In Progress to Resolved
- % Done changed from 40 to 100
我猜目前到這裡應該差不多了
(聽Jerry說James應該也會幫忙接後端)
如果到時候他們有問題 目前的資訊應該夠教他們 到時候再reopen issue.