成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<ul id="uiuqi"><noframes id="uiuqi">

<strike id="uiuqi"><input id="uiuqi"></input></strike>

<sup id="uiuqi"><strong id="uiuqi"></strong></sup>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

ChatGPT | 用GPT實現(xiàn)高考志愿系統(tǒng)

作者：周末程序猿 2024-06-19 10:48:31

數(shù)據(jù)采集首先用到的想到是爬蟲，但是卻面臨一個問題，數(shù)據(jù)的異構性，針對每個頁面都去寫爬蟲解析是非常麻煩，而且隨著頁面變動，可能原來解析方式又需要重新修改，為此結合GPT，出現(xiàn)了很多用GPT解析和整理網頁數(shù)據(jù)的開源項目，其中：ScrapeGraphAI比較好用。

高考出分將近，看到各種高考志愿一對一輔導，其實是利用信息差掙錢，但是隨著AI的技術快速發(fā)展，數(shù)據(jù)平權的時代已經到來，信息差不是特定人員的優(yōu)勢。為此，我和小伙伴們利用ChatGPT技術，開發(fā)了高考志愿智能填報系統(tǒng)。

圖片

志愿系統(tǒng)

體驗地址：http://gaokao.su007.club/

邀請碼：6mRtf GyJwco rhGXoK qDGln8 OPC7Ys

1、架構設計

架構設計

構建大語言模型的LLM，通過爬蟲抓取數(shù)據(jù)，進行清洗
數(shù)據(jù)清洗后，按照格式入庫到sqlite中
將sqlite按照格式，提供給LLM繼續(xù)微調
微調后，將模型部署提供API Server對外訪問

2、數(shù)據(jù)采集

數(shù)據(jù)采集首先用到的想到是爬蟲，但是卻面臨一個問題，數(shù)據(jù)的異構性，針對每個頁面都去寫爬蟲解析是非常麻煩，而且隨著頁面變動，可能原來解析方式又需要重新修改，為此結合GPT，出現(xiàn)了很多用GPT解析和整理網頁數(shù)據(jù)的開源項目，其中：ScrapeGraphAI比較好用。

開源地址：https://github.com/VinciGit00/Scrapegraph-ai

ScrapeGraphAI

使用樣例：

from scrapegraphai.graphs import SmartScraperGraph

graph_config = {
    "llm": {
        "model": "ollama/mistral",
        "temperature": 0,
        "format": "json",  # Ollama needs the format to be specified explicitly
        "base_url": "http://localhost:11434",  # set Ollama URL
    },
    "embeddings": {
        "model": "ollama/nomic-embed-text",
        "base_url": "http://localhost:11434",  # set Ollama URL
    },
    "verbose": True,
}

smart_scraper_graph = SmartScraperGraph(
    prompt="整理學校信息，包括學校名稱、地址 ...",
    source="https://www.gaokao.cn/school/search",
    cnotallow=graph_config
)

result = smart_scraper_graph.run()
print(result)

這里的輸出結果由于敏感，所以就不輸出；
由于高考數(shù)據(jù)在互聯(lián)網上比較多，所以可以搜一些相關的網頁都整理到AI Scraper中，自動分析數(shù)據(jù)；
如果有興趣的小伙伴可以嘗試一下，不過爬蟲可能被限制，然后需要遵守法律法規(guī)進行數(shù)據(jù)的爬??；

3、模型微調

數(shù)據(jù)整理好以后，就可以進行模型微調，解決AI志愿的推薦問題，當然這里又有另一種方式，就是通過few-shot Prompt，通過上下文進行對話，這樣也可以達到類似的效果，缺點就是上下文不能太長。

這里微調就使用：LLamaFactory+LLama3，使用界面就可以進行：

LLamaFactory

整理的數(shù)據(jù)集如下：

[
{
    "conversations": [
        {
            "from": "human",
            "value": "2024年高考600分，希望選北京的學校，該怎么選？"
        },
        {
            "from": "gpt",
            "value": "根據(jù)北京2023年xxx錄取分數(shù)線：{爬取的分數(shù)線數(shù)據(jù)和專業(yè)數(shù)據(jù)}，2022年xxx錄取分數(shù)線：{爬取的分數(shù)線數(shù)據(jù)和專業(yè)數(shù)據(jù)}，2021年xxx錄取分數(shù)線：{爬取的分數(shù)線數(shù)據(jù)和專業(yè)數(shù)據(jù)}，推薦...，原因是..."
        },
        ...
    ]
}
]

大約整理了10w條數(shù)據(jù)，經過一些調整參數(shù)最后微調完成以后，就可以部署到API Server中。

6、功能上線

圖片

圖片

圖片

責任編輯：武曉燕來源：周末程序猿

ChatGPT GPT 項目

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

主站蜘蛛池模板：精品无码三级在线观看视频 | 日韩精品一区二区三区视频播放 | 亚洲欧美激情精品一区二区 | 狠狠av | 欧美黑人一级爽快片淫片高清 | 99精品久久久久久中文字幕 | 久久国产精品视频 | 91久久国产精品 | 黄色一级片视频 | 一级欧美一级日韩片 | 在线免费观看黄色av | 午夜免费网| 成人国产精品久久 | 久日精品 | 欧美精品在线播放 | 国产成人精品在线播放 | 亚洲成人中文字幕 | 精品国产青草久久久久福利 | 在线超碰 | 久久人人爽人人爽人人片av免费 | 色毛片 | 国产成人自拍av | 亚洲欧美中文日韩在线v日本 | 国产精品久久 | 精品一二区 | 视频精品一区二区三区 | 亚洲视频在线观看 | 国产精品久久一区 | 欧美专区日韩专区 | 91精品国产一区二区在线观看 | 国产精品视频一区二区三区四区国 | 日韩三级在线观看 | 亚洲成人精品视频 | 日韩精品二区 | 日韩精品免费看 | 日韩免费一区 | 亚洲一区二区av | 国产一区二区三区在线 | 亚洲精品视频在线播放 | 欧美一区二区三区精品 | 日韩精品一区二 |

<strike id="a84oq"><dl id="a84oq"></dl></strike>

<source id="a84oq"><s id="a84oq"></s></source>

<table id="a84oq"><th id="a84oq"></th></table>

<fieldset id="a84oq"><optgroup id="a84oq"></optgroup></fieldset>

<em id="a84oq"></em>

<noscript id="a84oq"><pre id="a84oq"></pre></noscript>