Project

General

Profile

Actions

Support #289

closed

了解cacafly提供之PoC系統架構

Added by Mark Chiang about 1 month ago. Updated about 1 month ago.

Status:
Closed
Priority:
High
Assignee:
Start date:
10/14/2024
Due date:
10/18/2024
% Done:

100%

Estimated time:
40:00 h
Spent time:
Actions #1

Updated by Mark Chiang about 1 month ago · Edited

  • Status changed from New to In Progress
  • % Done changed from 0 to 10

程式在workflow的這裡

觸發bigquery裡面的這個 query後

從新聞裡面extract出來的資料(company, money, investor, acquirer, etc)會儲存在bigquery的這裡

query範例

SELECT
  *
FROM
  `biodnd.news.news_en_sample_pro`
WHERE
  Money != 'None'  ;

Actions #2

Updated by Mark Chiang about 1 month ago · Edited

至於最重要的query

他會先從這裡 呼叫LabelExample取得範例, 教LLM如何從新聞提取哪些重要訊息.

然後呼叫這裡 的 ReadArticle,
在這裡 程式會呼叫LLMgemini-flash 從biodnd.news.news_en_sample(儲存新聞的地方)讀新聞
然後把我們有興趣的資料提取出來成為JSON格式.
然後呼叫ParsedResult把他變成sql的結構回傳.
根據這行 CREATE OR REPLACE TABLE `biodnd.news.news_en_sample_test`
就會被放到 biodnd.news.news_en_sample_test

Actions #3

Updated by Mark Chiang about 1 month ago

  • % Done changed from 10 to 20
Actions #4

Updated by Mark Chiang about 1 month ago · Edited

  • % Done changed from 20 to 30

RAG 的部分 他們用 agent builder 來做

可以在這裡 把GCS上面的檔案設定進去

然後把上面的資料跟這裡 的應用程式連結在一起

然後可以在這裡 詢問

太平洋证券对生物医药行业有哪些展望?

搜尋的結果裡面按preview就會看到程式產的報告pdf, 很醜.

如果到這裡 搜尋, 按preview, 會看到原始我們餵進去的資料, 好看很多. 但是, 資料就外流了.

Actions #5

Updated by Mark Chiang about 1 month ago

  • % Done changed from 30 to 40

至於怎麼把 gcs 上面的文章轉成報告
主要是透過 ~/projects/cacafly/geneonline_rag
這一包是 RAG API
跑起來之後就有 API 可以呼叫
呼叫API就可以告訴他你想要把GCS上面的哪些資料寫成報告
寫成報告要用到的prompt在reports.py裡面
rag.py主要是讓你search的時候用的
比如說 你透過API呼叫run.py裡面的/summaryFolder, 它就會呼叫reports.py裡面的summary_folder
然後就會把GCS上面的某個folder裡面的文章都summarize.

Actions #6

Updated by Mark Chiang about 1 month ago · Edited

詳細API可以看下面文件
https://docs.google.com/document/d/1abEyw01cpOJsyE8t18ab57XPSQ0vGLKqbQ3wO23MyDE/edit#heading=h.82ou22o3gzw2

概念上就是 cacafly提供的是api
James 可以透過這個 api 去寫 file managment 的 前端
把檔案放上 gcs, 然後就可以呼叫這個 api 去把檔案弄進 rag 裡面,
然後就可以透過 rag 的 api 去問他.

Actions #7

Updated by Mark Chiang about 1 month ago

  • Status changed from In Progress to Resolved
  • % Done changed from 40 to 100

我猜目前到這裡應該差不多了
(聽Jerry說James應該也會幫忙接後端)
如果到時候他們有問題 目前的資訊應該夠教他們 到時候再reopen issue.

Actions #8

Updated by Mark Chiang about 1 month ago

  • Status changed from Resolved to Closed
Actions

Also available in: Atom PDF