成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Github Star 10k,超級好用的 OCR 數據合成與半自動標注工具

新聞 前端
OCR方向的工程師,一定需要知道這個OCR開源項目:PaddleOCR。

  

一、導讀

OCR方向的工程師,一定需要知道這個OCR開源項目:PaddleOCR

短短幾個月,累計Star數量已超過10k,

頻頻登上Github Trending 日榜月榜,

稱它為 OCR方向目前最火的repo絕對不為過。

最近,它又帶來四大新發布與升級:

核心內容先睹為快:

  • 全新發布數據合成工具Style-Text: 可以批量合成大量與目標場景類似的圖像,在多個場景驗證,效果均提升15%以上。
  • 全新發布半自動數據標注工具PPOCRLabel: 有了它數據標注工作事半功倍,相比labelimg標注效率提升60%以上,社區小規模測試,好評如潮。
  • 多語言識別模型效果升級: 在開源測試集評估,中文、英文、韓語、法語、德語、日文識別效果均優于EasyOCR。
  • PP-OCR開發體驗再升級: 支持動態圖開發(訓練調試更方便),靜態圖部署(預測效率更高),魚與熊掌可以兼得。

二、PaddleOCR歷史表現回顧

先看下PaddleOCR自去年6月開源以來,短短幾個月在GitHub上的表現:

  • 6月,8.6M超輕量模型發布,GitHub Trending 全球趨勢榜日榜第一。
  • 8月,開源CVPR2020頂會SOTA算法,再上GitHub趨勢榜單!
  • 10月,發布PP-OCR算法,開源3.5M超超輕量模型,再登Paperswithcode 趨勢榜第一。

 

這個含金量,廣大的GitHub開發者們自然懂,3.5M超超輕量模型的效果圖大家直接看,絕對杠杠的。

火車票、表格、金屬銘牌、翻轉圖片、外語都是妥妥的,3.5M的模型能達到這個識別精度,絕對是良心之作了!

傳送門:

Github:https://github.com/PaddlePaddle/PaddleOCR

那么最近的12月份更新,又給大家帶來哪些驚喜呢?

三、全新發布OCR數據合成工具:Style-Text

相比于傳統的數據合成算法,Style-Text可以實現特殊背景下的圖片風格遷移,只需要少許目標場景圖像,就可以合成大量數據,效果展示如下:

1、相同背景批量數據合成

2、相同文字批量數據合成

3、圖片分離前景背景

除了拉風的效果,采用這樣的合成數據和真實數據一起訓練,可以顯著提升特殊場景的性能指標,分別以兩個場景為例:

怎么樣,絕對是黑科技了吧。

這項能力核心算法是基于百度和華科合作研發的文本編輯算法《Editing Text in the Wild》https://arxiv.org/abs/1908.03047

不同于常用的基于GAN的數據合成工具,Style-Text主要框架包括 ①文本前景風格遷移模塊 ②背景抽取模塊 ③融合模塊。經過這樣三步,就可以迅速實現圖片文字風格遷移啦。

 

四、超強OCR數據標注工具:PPOCRLabel

除了數據合成,數據標注也一直是深度學習開發者關注的重點,無論是從成本還是時間上面,提高標注效率,降低標注成本太重要了。

PPOCRLabel通過內置高質量的PPOCR中英文超輕量預訓練模型,可以實現OCR數據的高效標注。CPU機器運行也是完全沒問題的。

話不多說,直接看PPOCRLabel效果演示:

用法也是非常的簡單,標注效率提升60%-80%是妥妥的。只能說,真的太香了。

五、最好的多語言模型效果

簡單對比一下目前主流OCR方向開源repo的核心能力:

中英文模型性能及功能對比

其中,部分多語言模型性能及功能(F1-Score)對比(僅EasyOCR提供)

值得一提的是,目前已經有全球開發者通過PR或者issue的方式為PaddleOCR提供多語言的字典和語料,在PaddleOCR上已經完成了全球主流語言的廣泛覆蓋:包括中文簡體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文(latin)、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達文、泰米爾文,也歡迎更多開發者可以參與共建。

六、PP-OCR開發體驗再升級

動態圖和靜態圖是深度學習框架常用的兩種模式。在動態圖模式下,代碼編寫運行方式符合Python程序員的習慣,易于調試,但在性能方面, Python執行開銷較大,與C++有一定差距。

相比動態圖,靜態圖在部署方面更具有性能的優勢。靜態圖程序在編譯執行時,預先搭建好的神經網絡可以脫離Python依賴,在C++端被重新解析執行,而且擁有整體網絡結構也能進行一些網絡結構的優化。

飛槳動態圖中新增了動態圖轉靜態圖的功能,支持用戶使用動態圖編寫組網代碼。預測部署時,飛槳會對用戶代碼進行分析,自動轉換為靜態圖網絡結構,兼顧了動態圖易用性和靜態圖部署性能兩方面優勢。

七、良心出品的中英文文檔教程

別的不需要多說了,大家訪問GitHub點過star之后自己體驗吧:

https://github.com/PaddlePaddle/PaddleOCR

 

 

責任編輯:張燕妮 來源: 程序員的那些事
相關推薦

2020-12-16 15:04:58

工具Github開發

2019-12-24 11:13:02

GitHub代碼開發者

2020-03-23 15:35:36

Java工具類Hutool

2018-06-12 16:33:23

GitHub替代品項目

2015-07-16 14:51:13

下載助手斷點續傳多任務

2023-09-20 08:02:09

Ceph客戶端

2019-07-17 15:29:46

GitHub數據科學學習

2022-04-28 13:17:10

低代碼開發工具

2019-07-05 11:01:59

Google電子商務搜索引擎

2017-07-20 16:40:36

大數據分析工具

2023-10-16 13:43:00

AI模型

2020-08-04 10:07:47

Web日志安全分析工具漏洞

2021-03-30 10:02:51

前端開發技術

2024-11-08 15:51:07

2019-03-06 09:47:33

工具代碼測試

2020-11-02 14:49:46

GitHub Java圖片

2020-10-28 09:50:05

GitHubPython項目

2021-09-09 07:21:25

項目GithubRedux-Thunk

2013-05-27 15:07:36

Eclipse插件

2022-07-18 15:48:43

數據庫開源工具
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91深夜福利视频 | 成人av鲁丝片一区二区小说 | 久久久精品网站 | 99精品国自产在线观看 | 精品一区二区三区中文字幕 | 成人福利在线视频 | 99re视频精品 | 可以在线观看av的网站 | 欧美国产日韩精品 | 亚洲免费在线观看视频 | 国产成人在线看 | 精品国产乱码一区二区三 | 精品久久久久久 | 久久av一区 | cao在线| av电影手机在线看 | 99精品在线| 国产真实乱对白精彩久久小说 | 日韩av免费在线观看 | 久久com | 欧美一区二区三区在线观看视频 | 日韩精品久久久久久 | 99久久免费观看 | 成人欧美一区二区三区在线播放 | av午夜电影 | 国产高清在线精品 | 国产激情一区二区三区 | 亚洲综合大片69999 | 天堂久久一区 | 日韩高清中文字幕 | 欧美综合一区二区三区 | 欧美视频 亚洲视频 | 欧美综合久久久 | 亚洲综合免费 | 日韩一区二区三区精品 | 免费国产视频 | 妞干网av| 国产精品欧美一区二区三区 | 日韩高清国产一区在线 | 岛国av免费观看 | 久久精品青青大伊人av |