成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

基于Vision Transformer的Latex公式識別系統的設計與實現

人工智能
近年來深度學習,在圖像與自然語言處理領域取得顯著成效.而這其中像ResNet、Transformer等網絡發揮著巨大作用。本系列主要分為3篇,分別從系統構建(環境+訓練)、系統原理(代碼層面)、系統的增強三個部分展開論述。

近年來深度學習,在圖像與自然語言處理領域取得顯著成效.而這其中像ResNet、Transformer等網絡發揮著巨大作用。本系列以https://github.com/lukas-blecher/LaTeX-OCR為例,闡述下如何基于人工智能技術實現latex公式識別服務。本系列主要分為3篇,分別從系統構建(環境+訓練)、系統原理(代碼層面)、系統的增強三個部分展開論述。

環境構建

查看cuda版本

下面看到,cuda版本最高支持到12.1,我們下面選用的cu116。

gpu版本查看

創建conda環境

conda env create -f 下述文件。

name: latex3.9
channels:
		- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
		- conda-forge
dependencies:
      - python=3.9
      - pip
      - pip:
            - tqdm>=4.47.0
            - munch>=2.5.0
            - torch==1.13.1+cu116
            - opencv_python_headless>=4.1.1.26
            - requests>=2.22.0
            - einops>=0.3.0
            - x_transformers==0.15.0
            - transformers>=4.18.0
            - tokenizers>=0.13.0
            - numpy>=1.19.5
            - Pillow>=9.1.0
            - PyYAML>=5.4.1
            - pandas>=1.0.0
            - timm==0.5.4
            - albumentations>=0.5.2
            - pyreadline3>=3.4.1
            - python-Levenshtein>=0.12.2
            - torchtext>=0.6.0
            - imagesize>=1.2.0
            - wandb>=0.15.5
            - --extra-index-url https://download.pytorch.org/whl/cu116

檢查pytorch與gpu是否兼容

import torch

if torch.cuda.is_available():
		cuda_version = torch.version.cuda
		print(f"PyTorch CUDA版本為: {cuda_version}")

		# 檢查CUDA版本是否與PyTorch兼容
		if torch.backends.cudnn.version() is None:
				print("PyTorch不支持當前CUDA版本")
		else:
				print("PyTorch支持當前CUDA版本")
else:
		print("PyTorch不支持GPU加速")

數據準備

準備數據(包括訓練集+驗證集+測試集)

現在訓練測試數據集,然后放的位置很講究!

數據存放位置

  • activate latex3.9 (這個在windows上執行,linux上 conda activate latex3.9)
  • python -m pix2tex.dataset.dataset --equations data/math.txt --images data/train --out data/train.pkl
  • python -m pix2tex.dataset.dataset --equations data/math.txt --images data/val--out data/val.pkl
  • python -m pix2tex.dataset.dataset --equations data/math.txt --images data/test--out data/test.pkl

訓練調試

Pycharm上debug訓練代碼

注:參數--config D:\LanJing\LaTeX-OCR-main\pix2tex\model\settings\debug.yaml --debug。

pycharm配置

debug.yaml配置修改

一輪epoch結束

加速訓練

為了加速訓練過程,可以使用提供的權重,并更新配置文件使用權重。該步驟也叫做fine tune。

下載 https://github.com/lukas-blecher/LaTeX-OCR/releases/download/v0.0.1/weights.pth

訪問權重路徑

訓練測試數據

https://drive.google.com/drive/folders/13CA4vAmOmD_I_dSbvLp-Lf0s6KiaNfuO。

數據集解釋

接下來在第二篇中我會重點介紹下,代碼的實現,如何構建這樣一個訓練網絡,以及它的關鍵代碼,尤其是數據shape是如何變化的。

責任編輯:姜華 來源: 今日頭條
相關推薦

2024-06-12 08:10:08

2009-06-29 10:34:34

VxWorks視頻采集系統

2019-06-25 13:47:50

人臉識別AI人工智能

2022-10-21 16:07:10

編碼器自然語言模型

2024-03-04 15:37:39

2015-05-11 10:25:54

2021-04-27 15:47:12

人工智能語音識別Transformer

2022-05-06 10:21:22

Python人臉識別

2021-11-24 08:55:38

代理網關Netty

2016-05-11 10:06:05

谷歌圖像識別web開發

2020-02-24 10:56:00

RSA大會網絡安全網絡攻擊

2009-06-14 22:09:24

Java界面布局DSL

2021-12-15 16:54:05

區塊鏈面部識別技術

2021-03-09 11:20:05

人臉識別人工智能AI

2022-09-02 11:59:41

AI算法

2022-09-14 09:37:22

數據系統

2024-08-02 19:49:41

2021-11-03 10:49:33

人臉識別人工智能技術

2009-05-18 09:11:00

IPTV融合寬帶

2021-06-01 06:59:58

運維Jira設計
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久婷婷国产麻豆91 | 久久综合九色综合欧美狠狠 | 国产一区二区日韩 | 精品麻豆剧传媒av国产九九九 | 成人三级网址 | 久草新在线 | 亚洲第一成年免费网站 | 久久天天 | 久草视频观看 | 91精品国产91 | 国产精品久久国产精品 | 日韩欧美手机在线 | 在线黄色网 | 免费观看一级特黄欧美大片 | 国产精品美女久久久久久久久久久 | 免费av毛片 | 五月激情六月婷婷 | 成人欧美一区二区三区黑人孕妇 | 中文亚洲字幕 | 国产精品久久久久久吹潮 | 亚洲精品一区二区三区 | 亚洲 成人 av | 男女羞羞免费视频 | 久久久91 | 天天色图 | 日韩精品999| 久久亚洲国产精品 | 超级乱淫av片免费播放 | 久久久久久久91 | 亚洲欧美在线一区 | 色婷婷综合久久久久中文一区二区 | 一区二区三区免费 | 精品一区二区在线视频 | 久久久精品一区二区三区 | 欧美日本韩国一区二区三区 | 第四色狠狠 | 免费xxxx大片国产在线 | 亚洲欧美视频 | 亚洲高清视频在线 | 色一情一乱一伦一区二区三区 | 国产精品视屏 |