A worldwide e-Infrastructure for NMR and structural biology

運用GROMACS網路伺服器執行分子動力模擬

這份教學將會詳細解說如何在WeNMR GROMACS web portal上執行分子動力模擬。你將會以spider toxin omega-AGA-IVB (PDB:1OMB)蛋白作為測試。美國密西根大學也提供了相當詳盡的的GROMACS教學(英文版)。我們會同時使用PDB結構檔案和預先準備的GROMACS輸入檔來開始一個這個運算。

這份教學的主要目的是使你熟悉GROMACS web portal如何操作,包括怎麼設定、操作以及應對各種你可能會遇到的情形。如果看完這份教學仍然有問題,以下連結有更詳細的資訊:


運用PDB結構開始一個分子動力模擬運算

主要的GROMACS web portal網頁是兩個網頁端的入口。這個網頁也會顯示主伺服器的狀態及重要的更新。所以建議使用者時常造訪此網頁。

在這個教學的第一部分,你藉由伺服器界面來設定一個以PDB結構為輸入的模擬運算。點擊主畫面的連結:以一個PDB檔案來開始你的GROMACS模擬"Start your GROMACS simulation from a structure file >>"。你唯一需要的輸入檔案是蜘蛛毒蛋白的結構檔案(1OMB.pdb)。這個界面會在實際模擬開始前,先用標準流程來設定模擬系統。這個標準流程是以最佳化的預設參數來設定系統,這麼做可以確保每一次的運算結果都是相同的。但你仍然可以在“選項”及“進階”中調整其中的參數。在這份教學中,我們大部份都使用預設的參數,但我們會詳細討論每個參數。

  • 注意:以下所描述的各項參數中,需要使用者作修改的將被標示為紅色;不需要特別修正的預設值將被標示為綠色

需要的參數

上傳你的PDB檔案:這個界面需要一個PDB結構檔。點擊“上傳檔案”來上傳教學附件中的1OMB.pdb。伺服器也接受GROMACS的.gro結構檔。

需要的事項以及限制的事項

  • 伺服器回應“Number of residues in PDB structure file # exceeds allowed number of residues #. Stopping”: GROMACS 網頁版限制運算系統的大小,目的是平均分配每個使用者的運算資源。目前伺服器允許的最大氨基酸數目是1200。
  • 伺服器回應“The following residue codes are not recognized by the GROMACS topology generation procedure: #.Stopping”: GROMACS伺服器目前提供標準氨基酸及核酸結構,只有這些在資料庫中的才能進行運算。如果是資料庫中沒有的殘基就會出現此錯誤訊息。你可以在這裡找到資料庫所包含的殘基結構。
  • 如果我需要運算資料庫所沒有的殘基,我該怎麼辦?現在以PDB運算的界面並不支援使用者自行提供GROMACS .itp殘基結構檔案。但是你可以在GROMACS二進制檔案上傳界面做運算。
  • 伺服器回應“PDB structure file contains no atoms. Stopping”: 當伺服器搜尋原子場時,無法在PDB檔案中找到原子就會顯示這個錯誤訊息。

選擇性參數

  • Simulation time(模擬時間): 以奈秒(ns)為單位定義模擬時間,在這個教學中,我們使用一奈秒。
  • Output resolution (輸出解析度)輸出解析度的定義是以奈秒為單位的時間間隔。輸出檔會以這個間隔來輸出系統演化過程中的快照。在這裡使用預設值:0.05奈秒

需要及限制的事項

  • Simulation time (模擬時間):GROMACS 網路伺服器可以運算0到50奈秒的模擬。在這個範圍中,系統會依照使用者的伺服器使用權分成三類:“ 簡易easy”使用權可以運算最高到10奈秒,“專業expert“使用權則可以到20奈秒,“大師guru”使用權則可以到50奈秒。預設值為每個使用者註冊後只有“簡易”使用權,更高的使用權必須另外要求。
  • Forcefield(力場)GROMACS網路伺服器支援大部份常見的力場(GROMACS, AMBER, OPLS, CHARMM)這個教學我們使用GROMACS96版53a6力場。
  • Solvent model(溶劑模型)伺服器會使用力場預設的溶劑模型。下方的表格顯示力場/溶劑模型的組合。但如果需要,你可以自由選擇不同的溶劑模型。這個教學我們使用“SPC”溶劑模型。
  • Treatment of electrostatic interactions(設定電力作用力)類似於溶劑模型,電力作用也是預先設定在力場中的。我們使用GROMACS96 53a6力場預設的Particle Mesh Ewald(PME)

下表列出了常用的力場/溶劑模型/電力作用力的組合

Force field family

Variants

Default solvent model

Default treatment of electrostatics

GROMOS 96

43a1, 43a2, 45a3, 53a5, 53a6

SPC

Twin-range cut-off (0.9/1.4 nm) with reaction field correction.

AMBER

03, 94, 96, 99, 99 SB, 99 SB-ILDN, GS

TIP3P

Particle-mesh Ewald, order of 4, 0.125 fourierspacing.

CHARMM 27

-

TIP3P

Shifted Coulomb Interaction (force switching). Shifted between 1.0 and 1.2 nm.

OPLS-AA

-

TIP4P

Particle-mesh Ewald, order of 4, 0.125 fourierspacing.

 

進階參數

  • Salt concentration(鹽類濃度)鈉離子和鉀離子會加到系統中以中和溶質所帶的電。此外,鈉離子和鉀離子可以另外加到使用者所要求的濃度,預設值是人體鹽濃度(0.1536mol/l)。
  • Temperature and pressure(溫度及壓力)以外界環境來說,溫度和壓力的相關性是很低的。改進的Berendsen coupling方法會用到溫度,壓力則是用Berendsen manostat控制。預設溫度是300K,壓力為1.0bar,但兩者在設定頁面皆可以更改。溫度的耦合時間為0.1皮秒,壓力則為0.3皮秒。在這個教學中我們使用預設值。
  • Minimal distance between periodic images(週期影像間的最小距離)以Angstrong為單位設定週期影相間的最小距離。設定這個參數的目的是避免蛋白在週期影像裡看到自己。系統會用模擬箱子的大小及分子大小自動計算這個參數。在這個教學,我們使用預設值2.25奈米。
  • Seed(起始值)以亂數定義特定起始值(速率分佈)。沒有必要設定特定的值,除非你有特定的原因,比如你想要重新執行一個和起始值一模一樣的模擬。
  • Perform basic set of analysis on the MD results(對分子動力模擬結果進行基本分析)預設這個選項是開啓的,如此一來伺服器會對分子動力模擬結果進行基本分析,包含:
  • 不同類型能量隨著時間的演化
  • 跟起始結構的方均根偏差隨著時間的變化
  • 由平均結構計算骨幹方均根擾動
  • 週期影像間的最小距離隨著時間的變化
  • 迴轉半徑隨著時間的改變
  • 二級結構元素隨著時間的改變

這些分析結果將會以圖像的方式呈現在模擬結果的頁面。

  • Perform simulations in a near-densest lattice packing simulation cell and roto-translational constraints(應用near-densest lattice packing模擬區域以及roto-translational constraints來實施模擬):預設是以菱形十二面體、週期影像距離為2.25奈秒來執行模擬。另一個選項是near-densest lattice packing,以此可建構最小的模擬盒子。依照不同的系統,在不影響溶質動態為前提,可以使模擬速度加倍。使用tight-fitting模擬盒子,必須要使用roto-translational constraints來避免重新定位導致違反週期影相間的最小距離。在這情況下,伺服器會強迫使用roto-translational constraints。使用菱形十二面體進行模擬,roto-translational constraints則是選擇性的。
  • Virtual sites(虛擬區)運用虛擬區是另一個增加模擬效率的方法。這是置換氫原子,移除系統中最快的震盪,否則會限制到可以用的時間。應用虛擬區可以使模擬的時間步驟從2fs升高到5fs。

提交你的GROMACS 分子模擬運算

紅色區域表示是必須要提供的資訊,當你填完所有必要資訊,你已經可以提交你的分子模擬運算。提供你的帳號密碼然後按下“提交”。所有資訊將會上傳到伺服器並且開始作業。作業時間通常少於一分鐘,包含檢驗PDB結構、提供的參數、以及你的使用權。

前一節已經描述檢驗PDB結構、參數的步驟等。如果有任何錯誤系統會馬上通知你。此外,你的使用權會影響你所能模擬的時間及同時間模擬的數目。“easy簡易”使用權可以讓你同時上傳五個模擬工作,“expert專業”可以到十個,“guru大師”則可以同時上傳二十個。

當檢驗成功後,你會被重新導向到模擬工作頁面。這個頁面會顯示你的模擬工作目前的狀態。它會每分鐘更新以提供你最新的工作狀態。建議你將這個頁面加到瀏覽器書籤中,如此一來你可以回到這個頁面。所有此重要的工作狀態改變會以email通知你。以下畫面是這個教學模擬結束時的結果畫面。

gromacs-resultspage.png

圖一、標準GROMACS網頁版分子動力模擬計算結果網頁的螢幕截取。這個工作已經完成。

你會花很多時間在這個顯示結果的網頁上,所以值得我們花一些時間介紹它的各項特點:

  • Project status(專案狀態):整個專案從開始到模擬結束到結果分析間的狀態會顯示在結果頁面的右上角。你可以找到專案編號,專案開始及結束日期,專案所需要的時間(時:分)以及專案的狀態(在這個例子顯示“完成“)。一個專案正常的週期,會從”運行中“,到”處理中“,”完成“。”運行中“表示專案仍在格網上模擬。當模擬完成,專案狀態會切換到”處理中“表示正在分析模擬的結果。最後的專案狀態會是”完成“。如果你或是管理者決定要停止模擬,狀態會顯示”中止“。如果模擬過程有發生任何錯誤,狀態會顯示”失敗“無論模擬的結果是成功或失敗,結果會儲存在伺服器上七天。”結果儲存時間“表示結果仍可以儲存在伺服器上的時間(時:分)。
  • Job status (工作狀態):GROMACS網頁版的設計是將模擬分成好幾個部分來完成。每個部分的狀態會顯示在結果頁面的左上角。跟專案狀態相似,它會顯示開始與結束時間,工作編號和總共模擬時間。工作狀態的將會從“未決定”上傳至格網,“已上傳”,“運行中”,從格網中取回結果並且“處理中”然後“完成”。很多原因會造成工作失敗,工作狀態會顯示“中止”然後伺服器會嘗試重新上傳這個工作到格網幾次,如果仍舊失敗工作狀態會顯示“失敗”。“檢查次數”即是表示重新嘗試上傳工作的次數,每一個子部分開始模擬時這個計數器都會先歸零。
  • Submission overview(上傳概觀): 結果頁面會顯示你所提供的參數作為參考
  • GROMACS MD results, partial downloads(GROMACS分子動力結果,部分下載):這個表格提供所有已經完成的子部分的概觀以及到含有結果的壓縮檔的連結。每一個子部分的開始、結束時間、及累積模擬時間(皮秒)都會顯示在這裡。請注意,從PDB結構檔進行模擬的第一個子部分是系統本身,所以模擬時間是0皮秒。實際的模擬是從第二個子部分開始。下載第一個子部分的資料夾可以讓你存取所有檔案,這些檔案是以標準化程序達到平衡。圖二顯示系統建立需要七個程序
  • Results(結果):當所有模擬結束,所有子部分的檔案會合併到一個大的路徑下。這些最終的結果可以在結果頁面左上角的連結,以壓縮檔下載。

gromacs-mdsetup.png

圖二、從PDB結構或是GROMACS結構開始進行模擬前,分子模擬系統建立的七個標準化步驟的示意圖。表格顯示七個步驟的描述在運行底下,用到的GROMACS可執行檔,可調整的選項,以及產生的檔案。第八個步驟是產生模擬可以讓長時間的模擬分成好幾個子部分來運作。


與伺服器互動

這個專案結果畫面提供一些按鈕讓你在模擬過程中與伺服器互動。簡而言之,這些按鈕的功能如下:

  • 中止工作(Abort job):中止正在運行的工作。系統會詢問你是否真的確定你要中止,因為你將不能重新啓動已中止的工作。終止陳舊的工作對於工作列及格網資源是非常好的幫助。
  • 重新上傳前一個工作(Resumit last job):如果一個模擬子部分沒有成功地在格網上運行,伺服器嘗試十次仍舊沒有成功,你可以用這個按鈕手動再次上傳這個工作。但是強烈建議你先下載這個子部分的檔案確認檔案本身沒有任何錯誤。
  • 合併子部分(Combine parts):這個按鈕將會合併所有模擬子部分並且製造一個到目前為止的模擬結果,如果你有要求,系統會進行品質評定分析。這個功能可以讓你在模擬還沒有結束時存取模擬目前的進度。
  • 視察記錄(View log):這個按鈕會顯示此專案的記錄檔。此檔案的細節有可能在出錯時對於除錯有幫助。
  • 延長模擬(Extend simulation):讓你可以延長目前已經結束的模擬到數奈秒,長度仍然取決於使用者的權限。

你的模擬正在運行,下一步呢?

基本上,上傳完工作後你可以放鬆坐下。伺服器會管理所有模擬的建立及所有子部分的運作直到專案結束。系統將會以email通知你任何重大的狀態改變,比如說新的模擬子部分開始運行,或是模擬結束。

完成一個完整模擬所需要的子部分的數目會因為你系統的大小、模擬總時間、以及格網的效率而有所不同。這個教學,將會需要2到3個子部分來完成整個模擬。

然而,如果模擬並沒有如同預期開始運行,請查詢記錄檔。以下是一些記錄訊息及他們的意義:

  • 工作成功上傳但是已經超過兩小時仍沒有開始運行,中止並且重新嘗試(Job was submitted but did not start running for more than 2 hours. Abort and try again):一個已上傳的工作可能會在被分配到的格網中等待超過兩個小時,或是與網站的連結無法建立,伺服器會終止此工作並且重新上傳。
  • 通知使用者號碼“失敗”工作狀態。訊息:你的GROMACS工作失敗了,更多訊息在上方URL網址(Notified user # of FAILED job status. Message: Your GROMACS job has FAILED. More information may be ailable at the URL above):伺服器嘗試十次後仍沒有辦法成功的上傳模擬子部分或模擬結果回傳錯誤。下載最後一個子部分的檔案並且檢查GROMACS檢查檔,檢查模擬本身是否遇到問題。如果模擬本身是正常的,或許你可以嘗試重新上傳最後一個模擬子部分。

從一個預先做好的GROMACS二進制檔開始一個GROMACS分子動力模擬

這個教學第二部分你將會用伺服器界面及GROMACS二進制檔(.tpr)建立一個模擬。點擊“用二進制檔開始你的GROMACS模擬”連結到界面。

上傳檔案界面只需要你定義一些基本的參數:

  • GROMACS portable binary run input file: 用上傳鈕上傳你的GROMACS二進制檔1OMB.tpr
  • GROMACS checkpoint file: 如果你的模擬已經跑了數個皮秒/奈秒,GROMACS將會製造一個檢查點檔案(.cpt)允許模擬可以從最後一個記錄的截取圖。在這個教學中,模擬已經跑了20皮秒而且我們可以從這邊開始。用上傳鈕上傳1OMB.cpt檔。

需要的事項及限制的事項:

  • 多核心平行運算(multi-threading):如果模擬是在多核心,一個檢查點會把系統分開。意思是分割你的系統必須要符合GROMACS網路版的分割方式
  • 模擬時間(Simulation time): 你必須要指定一個模擬時間,這個教學使用預設時間是1.0奈秒。定義的模擬時間會依照你的使用權及二進制檔案裡設定的模擬時間做檢查。如果設定的模擬時間比二進制檔案裡的還要長,那系統會使用較長的模擬時間。
  • 執行一組基本的分子模擬結果分析(Perform basic set of analysis on the MD results): 這個選項預設是開啓的,可以讓系統執行一系列基本分析包含:
  • 不同能量隨著時間的演化
  • 與起始結構方均根差隨著時間的變化
  • 與平均結構的骨幹方均根差
  • 週期性影像的最小距離隨著時間的變化
  • radius of gyration隨著時間的變化
  • 二級結構隨著時間的變化

這個分析輸出檔將會以圖像的方式顯示在結果頁面


上傳你的GROMACS分子模擬

填完網頁上所有必須填入的(紅色標記)項目後,你已經準備好可以上傳你的分子動力專案。提供你的帳號密碼,然後按下上傳。網頁上你填入的資料將會送到伺服器上process,通常不會超過一分鐘。確認過你的資料後,你將會重新導向到結果頁面如同“從PDB結構檔開始一個GROMACS分子動力專案”


參考文獻

  1. Berendsen, H.J., J.P. Postma, W.F. van Gunsteren, and J. Hermans, Interaction models for water in relation to protein hydration., in Intermolecular Forces, B. Pullman, Editor. 1981, D. Reidel Publishing Co.: Dordrecht. p. 331-342.
  2. Bekker, H.; van den Berg, J. P.; Wassenaar, T. A. J. Comput. Chem. 200425, 1037–1046.
  3. Berendsen, H. J. C.; van Gunsteren, W. F. Molecular dynamics simulations: Techniques and approaches. In Molecular Liquids: Dynamics and Interactions; Barnes, A. J.; Orville-Thomas, W. J.; Yarwood, J., Eds.; Reidel; Dorderecht, The Netherlands, 1984; pp. 475–500.
0
Your rating: None

Cite WeNMR/WestLife

 
Usage of the WeNMR/WestLife portals should be acknowledged in any publication:
 
"The FP7 WeNMR (project# 261572) and H2020 West-Life (project# 675858) European e-Infrastructure projects are acknowledged for the use of their web portals, which make use of the EGI infrastructure and DIRAC4EGI service with the dedicated support of CESNET-MetaCloud, INFN-PADOVA, NCG-INGRID-PT, RAL-LCG2, TW-NCHC, SURFsara and NIKHEF, and the additional support of the national GRID Initiatives of Belgium, France, Italy, Germany, the Netherlands, Poland, Portugal, Spain, UK, South Africa, Malaysia, Taiwan and the US Open Science Grid."
 
And the following article describing the WeNMR portals should be cited:
Wassenaar et al. (2012). WeNMR: Structural Biology on the Grid.J. Grid. Comp., 10:743-767.

EGI-approved

The WeNMR Virtual Research Community has been the first to be officially recognized by the EGI.

European Union

WeNMR is an e-Infrastructure project funded under the 7th framework of the EU. Contract no. 261572

WestLife, the follow up project of WeNMR is a Virtual Research Environment e-Infrastructure project funded under Horizon 2020. Contract no. 675858

West-Life