成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

基于AWS習練深度學習時的10個Linux命令

企業動態
在AWS上執行大規模的深度學習處理是一個廉價而且有效的學習和開發方式。花少量的錢就可以使用數十GB的內存,數十個CPU,多個GPU,這是值得推薦的。

[[202373]]

在AWS上執行大規模的深度學習處理是一個廉價而且有效的學習和開發方式。花少量的錢就可以使用數十GB的內存,數十個CPU,多個GPU,這是值得推薦的。

如果你是使用EC2或者Linux 命令的新人,在云端執行深度學習腳本的時候, 這些命令是非常有效的。

本文的主要內容包括:

1)在本機和EC2實例間復制數據

2)使腳本按天,周,月安全地運行

3)監測進程,系統和GPU 的性能

注意:所有命令在類linux環境中執行(Linux,OS x 或者 cygwin)

0、環境約定

假設AWS EC2 已經正常運行,方便起見,對環境做如下的設定:

1)EC2 服務器的IP地址為 54.218.86.47

2)用戶名為ec2-user

3)SSH 密鑰位于 ~/.ssh/ 中,文件名為aws-keypair.pem;

4)使用python 腳本工作

關于如何搭建一個 基于GPU的EC2實例來 執行深度學習,可以參見:

https://machinelearningmastery.com/develop-evaluate-large-deep-learning-models-keras-amazon-web-services/

1、 登陸到服務器

在做任何操作之前,首先要登陸到目標服務器。簡單地,使用SSH命令。將SSH 密鑰存儲在 ~/.ssh/ 中,使用有意義的文件名,例如aws-keypair.pem。使用如下命令登陸EC2主機,注意地址和用戶名:

  1. ssh -i ~/.ssh/aws-keypair.pem ec2-user@54.218.86.47 

2、 拷貝文件到服務器

使用SCP命令拷貝本地文件到服務器,例如將script.py 文件拷貝到EC2 服務器的命令如下:

  1. scp -i ~/.ssh/aws-keypair.pem script.py ec2-user@54.218.86.47:~/ 

3、使腳本在服務器的后臺運行

在服務的后臺執行腳本,可以忽略其他進行的信號量,忽略標準的輸入輸出,將所有的輸出和錯誤信息重定向到一個日志文件中。對于需要長時間運行的深度學習模型而言, 這是非常必要的。

  1. > nohup python /home/ec2-user/script.py >/home/ec2-user/script.py.log </dev/null 2>&1 & 

該命令中script.py 和 script.py.log 都位于 /home/ec2-user/ 目錄下。關于 nohup 和重定向 參考其他的詳細介紹(例如wikipedia中的介紹)。

4、在服務器的指定 GPU 上執行腳本

如果EC2 支持的話,推薦在同時運行多個腳本。例如,EC2有4個GPU的話, 可以在每個GPU上單獨運行一個腳本,示例代碼如下:

  1. CUDA_VISIBLE_DEVICES=0 nohup python /home/ec2-user/script.py >/home/ec2-user/script.py.log </dev/null 2>&1 & 

如果有4個GPU的話,可以指定CUDA_VISIBLE_DEVICES從0到3。這在TF做后臺的Keras上是可行的,在Theano 沒有測試過。

關于CUDA_VISIBLE_DEVICES 的更多信息可以參見https://devblogs.nvidia.com/parallelforall/cuda-pro-tip-control-gpu-visibility-cuda_visible_devices/

5、監測腳本的輸出

如果輸出結果中有項目評分或者一個算法的運行結果,實時監控腳本的輸出是很有意義的。示例如下:

  1. tail -f script.py.log 

遺憾的是,當屏幕上在一段時間沒有輸出的時候,AWS 會關閉這個終端,所以最好使用:

  1. watch "tail script.py.log" 

有的時候看不到python的標準輸出,不知道是python的問題還是EC2的問題。

6、監測系統和進程的性能

監測EC2系統的性能是有意義的,尤其是已經使用了或還剩下多少內存。例如:

  1. top -M 

或者指定進程標識PID:

  1. top -p PID -M 

7、監測GPU 性能

如果在GPU上同時執行多個腳本,并行執行的話,查看每個GPU 的性能和使用率是不錯的主意。例如:

  1. watch "nvidia-smi" 

8、檢查腳本是否還在服務器上運行

一般地,會保持終端一直是開著的。

  1. watch "ps -ef | grep python" 

9、在服務器上編輯文件

一般不建議在服務器直接修改,當然你熟知vi除外:

  1. vi ~/script.py 

vi 的用法就不在這里贅述了。

10、從服務器上下載文件

與上傳文件相對,這是一個下個png文件的例子:

  1. scp -i ~/.ssh/aws-keypair.pem ec2-user@54.218.86.47:~/*.png . 

需要注意的幾點

  • 如果希望同時運行多個腳本,最好選用擁有多個GPU 的EC2
  • 最好在本地編寫腳本
  • 將執行結果輸出到文件,下載到本地進行分析
  • 使用watch 命令保持終端處于運行中
  • 在本地執行遠程命令

原文參見 https://machinelearningmastery.com/command-line-recipes-deep-learning-amazon-web-services/

實際上,其中多是后臺開發工程師的基本功,只是對興趣愛好者而言有一點兒參考價值而已。

【本文來自51CTO專欄作者“老曹”的原創文章,作者微信公眾號:喔家ArchiSelf,id:wrieless-com】

戳這里,看該作者更多好文

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2017-09-07 15:10:18

深度學習AWSLinux命令

2017-03-20 14:37:43

Linux命令

2018-09-13 10:00:02

Linux命令危險命令

2014-03-17 17:27:51

Linux mvLinux 命令

2021-09-28 15:20:51

Python代碼命令

2017-05-22 12:30:15

深度學習人工智能

2023-05-22 08:00:00

深度學習機器學習人工智能

2014-04-08 15:05:11

LinuxLinux命令行補全命令

2018-04-20 09:58:10

Linux命令sudo

2015-12-03 09:46:50

收集硬件Linux命令

2013-12-23 11:01:14

命令Linux命令

2014-03-18 14:00:19

Linux監控命令

2015-11-17 09:35:26

開源學習框架

2018-09-18 10:55:24

人工智能機器學習深度學習

2018-08-16 13:56:32

2022-10-26 15:41:38

深度學習Deepfake機器學習

2024-11-04 08:14:48

2013-11-19 11:59:49

Linux命令Shell腳本

2018-08-20 19:00:56

Linux性能檢測命令

2011-07-06 09:27:55

Linux命令
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产视频精品区 | av在线免费播放 | 91视频免费在观看 | 黄色大片免费播放 | 国产视频中文字幕 | 亚洲一区二区三区视频 | 中文字幕 在线观看 | 色欧美片视频在线观看 | 国产不卡视频 | 亚洲成人国产 | 欧美亚洲在线视频 | 精品久久久久久久久久久久 | 9999国产精品欧美久久久久久 | 国产精品免费看 | 国产精品日韩在线观看 | 国产一在线观看 | 99热国产在线播放 | wwww.xxxx免费 | 国产一级影片 | 一区二区三区四区在线视频 | 91精品国产91久久综合桃花 | 成人国产a | 午夜免费福利影院 | 久久久精品网 | 午夜一级做a爰片久久毛片 精品综合 | 国产成人99久久亚洲综合精品 | 亚洲精品一区二区 | 草草视频在线播放 | 国产日韩欧美一区二区在线播放 | 久久不射电影网 | 久久综合亚洲 | 91精品国产综合久久福利软件 | 天天干天天爱天天操 | 啪啪免费网 | 国产精品久久久久永久免费观看 | 黄色一级片在线播放 | 国产精品mv在线观看 | 亚洲精品自在在线观看 | 亚洲一二三区在线观看 | 伊人伊人网 | 久艹网站 |