自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

在 Ubuntu 上安裝 SLURM 集群資源管理器

運(yùn)維 系統(tǒng)運(yùn)維
SLURM 通過一對冗余集群控制節(jié)點(diǎn)(冗余是可選的)來管理集群計(jì)算節(jié)點(diǎn),是由一個(gè)名為 slurmctld 的管理守護(hù)程序?qū)崿F(xiàn)的,slurmctld 提供了對計(jì)算資源的監(jiān)視、分配和管理,并將進(jìn)入的作業(yè)序列映射和分發(fā)到各個(gè)計(jì)算節(jié)點(diǎn)上。

  SLURM 是一個(gè)類似 Sun Grid Engine (SGE) 的開源分布式資源管理軟件,用于超級計(jì)算機(jī)和大型計(jì)算節(jié)點(diǎn)集群,可高度伸縮和容錯。SUN 被賣給 Oracle 后,好用的 SGE 變成 Oracle Grid Engine 并且從 6.2u6 版本開始成為商業(yè)軟件了(可以免費(fèi)使用90天),所以我們不得不另尋其他的開源替代方案,SLURM 是上次在德班高性能會議的時(shí)候一位陌生人介紹的,聽上去不錯。

  SLURM 通過一對冗余集群控制節(jié)點(diǎn)(冗余是可選的)來管理集群計(jì)算節(jié)點(diǎn),是由一個(gè)名為 slurmctld 的管理守護(hù)程序?qū)崿F(xiàn)的,slurmctld 提供了對計(jì)算資源的監(jiān)視、分配和管理,并將進(jìn)入的作業(yè)序列映射和分發(fā)到各個(gè)計(jì)算節(jié)點(diǎn)上。每個(gè)計(jì)算節(jié)點(diǎn)也有一個(gè)守護(hù)程序 slurmd,slurmd 管理在其上運(yùn)行的節(jié)點(diǎn),監(jiān)視節(jié)點(diǎn)上運(yùn)行的任務(wù)、接受來自控制節(jié)點(diǎn)的請求和工作、將工作映射到節(jié)點(diǎn)內(nèi)部等等。圖示如下:

  官方網(wǎng)站提供的 Super Quick Start 安裝文檔一點(diǎn)都不 quick,看了頭大。以下步驟使用兩臺服務(wù)器演示:主機(jī)名為 slurm00 的服務(wù)器用作控制節(jié)點(diǎn);主機(jī)名為 slurm01 的服務(wù)器用作計(jì)算節(jié)點(diǎn)。

  在控制節(jié)點(diǎn)和計(jì)算結(jié)點(diǎn)分別安裝 slurm 包,這個(gè)包里面既含有控制節(jié)點(diǎn)需要的 slurmctld 也含有計(jì)算結(jié)點(diǎn)需要的 slurmd:

  # apt-get install slurm-llnl

  控制節(jié)點(diǎn)和計(jì)算結(jié)點(diǎn)之間需要通信,通信就需要認(rèn)證,slurm 支持兩種認(rèn)證方式:Brent Chun’s 的 authd 和 LLNL 的 MUNGE,MUNGE 是專為高性能集群計(jì)算打造的,這里我們選用 MUNGE,生成 key 后啟動 munge 認(rèn)證服務(wù):

  # /usr/sbin/create-munge-key
  Generating a pseudo-random key using /dev/urandom completed.
  # /etc/init.d/munge start

  使用 SLURM Version 2.3 Configuration Tool 在線配置工具生成配置文件,然后把配置文件拷貝控制節(jié)點(diǎn)以及各個(gè)計(jì)算結(jié)點(diǎn)的 /etc/slurm-llnl/slurm.conf(是的,控制節(jié)點(diǎn)和計(jì)算結(jié)點(diǎn)使用同一個(gè)配置文件)。

  有了配置文件和啟動了 munge 服務(wù)后就可以在控制節(jié)點(diǎn)啟動 slurmctld 服務(wù)了:

  # /etc/init.d/slurm-llnl start
  * Starting slurm central management daemon slurmctld         [ OK ]

  把控制節(jié)點(diǎn)生成的 munge.key 拷貝到各個(gè)計(jì)算結(jié)點(diǎn):

  # scp /etc/munge/munge.key ubuntu@slurm01:/etc/munge/

  登陸計(jì)算節(jié)點(diǎn)后啟動 munge 服務(wù)(注意需要改變 munge.key 的 owner 和 group 為 munge,否則會啟動失?。┖?slurmd 服務(wù):

  # ssh ubuntu@slurm01
  # chown munge:munge munge.key
  # /etc/init.d/munge start
  * Starting MUNGE munged                        [ OK ]
  # slurmd

  在控制節(jié)點(diǎn)上(slurm00)測試一下是否順利連接到計(jì)算結(jié)點(diǎn)(slurm01),并且簡單運(yùn)行一個(gè)程序 /bin/hostname 看看效果吧:

  # sinfo
  PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
  debug*       up   infinite      1   idle slurm01
  # srun -N1 /bin/hostname
  slurm01
責(zé)任編輯:黃丹 來源: vpsee.com
相關(guān)推薦

2009-06-30 12:15:09

資源管理器Oracle性能

2011-08-09 16:12:39

Windows7資源管理器

2010-01-08 08:54:41

Windows 7資源管理器

2009-02-17 20:16:00

Vista加標(biāo)題資源管理器

2011-02-23 10:06:25

konqueror

2023-08-29 06:22:18

Windows 10微軟

2009-09-07 09:08:50

Windows 7資源管理器鏈接

2011-08-19 10:31:08

資源管理器

2012-07-30 15:22:21

Win 7操作系統(tǒng)

2012-08-27 14:01:18

VS 2012

2010-01-14 09:07:31

Windows 7導(dǎo)航面板

2009-11-13 14:03:37

ADO.NET資源管理

2011-08-30 09:45:04

Windows 8

2019-07-18 09:56:50

Windows 10資源管理器文件

2009-10-10 11:47:26

服務(wù)器測試方案

2016-12-23 09:51:27

Windows 10OneDrive管理器

2021-10-10 21:25:19

Windows 11Windows微軟

2012-06-19 14:45:46

Windows 8資源管理器

2009-12-08 17:09:42

Windows 7資源

2009-08-13 09:22:18

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號