成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌剛剛發布了2500萬個免費數據集,快來了解一下

開發 開發工具 大數據
最近,谷歌發布了免費工具datasetsearch,它可以搜索2500萬個公開可用的數據集。搜索工具包括過濾器,可基于許可證(免費或付費)、格式(csv,圖像等)和更新時間限制結果。

[[316672]]

來源:Pexels

 

注意:谷歌的新數據集搜索工具已于2020年1月23日問世。

疫情防控階段,大家的“寒假“越過越長,這么“長”時間的寒假能做些什么呢?

最近,谷歌發布了免費工具datasetsearch,它可以搜索2500萬個公開可用的數據集。

搜索工具包括過濾器,可基于許可證(免費或付費)、格式(csv,圖像等)和更新時間限制結果。

結果還包括對數據集內容的描述以及作者的引用。

谷歌的數據集聚合方法不同于其他數據集存儲庫(如亞馬遜的開放數據注冊表)。與其他自行管理和托管數據集的存儲庫不同,谷歌不會直接管理或提供2500萬個數據集的訪問權限。

取而代之的是,谷歌依靠數據集發布者,使用 schema.org的開放標準描述其數據集的元數據。然后,谷歌索引元數據,并使其在發布者之間可搜索。

發布者仍需自己托管數據集,因此符合schema.org標準的營利性發布者也將使用谷歌為其數據集建立索引。根據以往經驗,筆者發現,搜索與市場相關的數據集時,其百分比更高,搜索結果中約有一半的數據集來自營利性聚合器。

該平臺上其他受歡迎的數據集發布者包括政府機構和研究機構。谷歌聲稱,僅美國政府機構就已經發布了超過200萬個數據集。

據谷歌統計,大多數數據集涉及”地球科學、生物學和農業領域。”

簡單使用schema.org的開放標準即可發布自己的數據集。越來越多的出版商遵守該標準,公開可用的數據集的數量可能會持續增長。

目前,谷歌未提供用于搜索或下載免費數據集的API。

網上數百萬個數據集出沒

在網絡上,用戶感興趣的任何主題,幾乎都有數百萬個數據集。如果想購買一只小狗,可以查找數據集來匯總買家的投訴或查找對小狗認知度的研究?;蛘?,如果喜歡滑雪,可以查找有關滑雪勝地收入或受傷率及受傷人數的數據。Dataset Search 已為其中近2500萬個數據集建立了索引,可以在一個地方搜索數據集并查找指向數據所在位置的鏈接。在過去一年里,人們對其進行嘗試并提供了反饋,現在DatasetSearch正式退出測試版。

查詢“滑雪”的一些搜索結果,涉及最快滑雪者的速度以及滑雪勝地收入的數據集。

Dataset Search有何創新之處?

根據從DatasetSearch早期試用版中得到的反饋,開發者添加了新功能?,F在,根據所需的數據集類型(例如表格、圖像、文本)或是否可以從提供商處免費獲得數據集,就可以過濾結果。如果數據集是關于某個地區的,可以查看地圖。另外, 該產品現在可以在移動設備上使用,并且數據集描述的質量得到了極大改善。然而,一件事情沒有改變:發布數據的任何人都可以使用開放標準(schema.org)在自己的網頁上描述其數據集的屬性,從而使人們在搜索中可以發現數據集。

開發者還了解到有不同類型的人在尋找數據。有一些學術研究人員正在尋找可以支持其假設的數據(例如:嘗試催產素)、學生查找表格形式并涵蓋其高級論文主題的免費數據(例如:嘗試使用相應過濾器的監禁率)、業務分析師和數據科學家尋找有關移動應用程序或快餐店等的信息。所有這些都有數據!用戶都搜索什么呢?最常見的查詢包括“教育”、“天氣”、“癌癥”,“犯罪”、“足球”和“狗”。

上圖為查詢“快餐店”的一些搜索結果。

在Dataset Search里有哪些數據集?

Dataset Search還提供了網上數據的快照。此處有一些亮點。數據集涵蓋的最大主題是地球科學、生物學和農業。世界上大多數國家的政府都會發布數據,并使用schema.org對其進行描述。美國可用的開放政府數據集超過200萬,在數量上遙遙領先。最受歡迎的數據格式是什么?用戶可以在DatasetSearch中找到超過600萬張表格。

在Dataset Search中找到的數據集數量持續增加。如果站點上有一個數據集,并使用開放標準schema.org對其進行了描述,其他人可以在DatasetSearch中找到它。如果知道一個數據集存在,但是在DatasetSearch中找不到它,請要求提供者添加schema.org描述,其他人也將了解他們的數據集。

未來何去何從?

DatasetSearch已退出測試版,但無論產品是否有“測試版”,改進都將繼續。快下載體驗DatasetSearch吧!

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2024-04-16 13:34:26

JSONMsgpack存儲

2021-12-15 10:29:44

iOS蘋果系統

2023-10-08 10:37:48

springweb版本

2024-10-31 13:49:04

2024-04-11 12:19:01

Rust數據類型

2021-01-18 05:19:11

數字指紋

2024-09-19 09:30:39

緩存框架抽象

2020-03-01 17:53:38

Excel大數據微軟

2022-03-24 13:36:18

Java悲觀鎖樂觀鎖

2020-12-10 08:44:35

WebSocket輪詢Comet

2021-01-21 10:23:43

數據庫架構技術

2019-11-27 11:27:52

分布式存儲系統

2021-10-18 13:37:35

谷歌勒索軟件網絡安全

2017-12-14 16:55:33

2018-06-05 17:40:36

人工智能語音識別

2020-02-10 14:26:10

GitHub代碼倉庫

2019-02-20 14:16:43

2015-10-23 17:09:27

Snappy Ubun

2018-07-11 15:04:16

人工智能知識圖譜

2019-09-20 08:00:00

開發技能Web開發 人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级黄色大片 | 蜜桃五月天 | 国产精品久久久久久 | 超碰人人爱 | 欧美日韩国产中文字幕 | 日韩av一区二区在线观看 | 在线观看中文视频 | 在线观看中文字幕dvd播放 | 日日操视频 | 精品亚洲一区二区三区四区五区 | 国产精品一区二区免费 | 亚洲aⅴ精品| 毛片99| 欧美日韩一区在线 | 国产网站在线播放 | 亚洲黄色成人网 | 国产毛片久久久 | 中文字幕一区在线观看视频 | 亚洲欧美在线一区 | 在线观看中文字幕 | 中文字幕乱码一区二区三区 | 中文字幕日韩在线观看 | 欧美自拍一区 | 天天爱天天操 | 欧美综合久久久 | 成人深夜福利 | 国产综合久久 | 91中文字幕在线 | 亚洲日韩中文字幕一区 | 爱爱免费视频网站 | 成人黄色av网址 | 日本一卡精品视频免费 | 国产一区二区三区四区 | avav在线看 | 国产精品久久久久久福利一牛影视 | 欧美精品日韩精品国产精品 | 四虎影院免费在线 | 精品一区二区三区四区在线 | 男人的天堂avav | 精品乱码一区二区三四区 | 欧美精品在线一区 |