首頁 > 搜索引擎 > 正文

人工智能如何幫助科學家尋找新粒子?

時間:2018-09-13 09:48:41 來源:新浪科技 評論:0 點擊:0
  在搜尋新基本粒子的過程中,物理學家總是需要對粒子的行為作出假設,但新的機器學習算法卻不用這么做。

  9月13日消息,據國外媒體報道,大型強子對撞機(LHC)可以在一秒鐘之內撞擊十億對質子。有時,這臺巨大的機器可能會給現實世界帶來驚喜,因為在少數碰撞中,會產生一些前所未有的東西。但是,這樣的驚喜并沒有什么規律可言,物理學家并不確切知道要尋找什么。他們擔心,在將數十億次碰撞所獲得的數據梳理成更易管理的數字時,可能會無意中刪掉物理學新理論的證據。在歐洲核子研究中心(CERN)參與超環面儀器(ATLAS)實驗的紐約大學粒子物理學家凱爾·克蘭默(Kyle Cranmer)說:“我們總是擔心自己會把嬰兒和洗澡水一起倒掉。”

  面對智能數據規約的挑戰,一些物理學家嘗試使用“深度神經網絡”的機器學習技術來挖掘相似事件組成的數據海洋,尋找新的物理學現象。

  在初步使用案例中,深度神經網絡通過研究大量標記為“貓”的圖片和標記為“狗”的圖片,學習如何區分貓和狗。然而,這種方法在尋找新粒子時并不適用,因為物理學家無法為機器提供他們從未見過的東西的圖片。因此,物理學家轉而采用所謂的“弱監督學習”(weakly supervised learning)方法,即機器從已知粒子開始,利用細化的信息(比如總體上可能發生的頻率)來尋找罕見事件。

  在今年5月份發表于科學預印本網站arxiv.org上的一篇論文中,三位研究人員提出應用相關策略對“撞擊狩獵”(bump hunting)進行擴展。這種經典的“粒子狩獵”技術曾用于希格斯玻色子的發現。美國勞倫斯伯克利國家實驗室的研究者本·納赫曼(Ben Nachman)表示,具體的思路是訓練機器在數據集中尋找罕見的變化。

  試想一下,我們可以在貓狗實驗的原理基礎上做一個游戲:在充滿北美森林觀察記錄的數據集中尋找新的動物物種。假設任何新的動物物種都傾向于聚集在某個特定的地理區域(與新粒子圍繞某個特定質量的概念相對應),那算法就應該可以通過鄰近區域的系統比較,將它們挑出來。如果加拿大不列顛哥倫比亞省剛好有113只馴鹿,美國華盛頓州有19只馴鹿(即使數據集中有數百萬只松鼠),那程序也能在沒有直接研究馴鹿的情況下,學會將馴鹿與松鼠區分開來。弱監督學習研究者、俄勒岡大學的理論粒子物理學家說:“這不是魔術,但感覺像魔術一樣。”

  相比之下,粒子物理學中的傳統搜索方法通常要求研究人員對新現象是什么樣子做出假設。他們會創建一個描述新粒子行為的模型。例如,一個新粒子可能有衰變成一大群已知粒子的趨勢。只有在定義了所要尋找的東西之后,他們才能設計出自定義的搜索策略。這項工作通常需要花費一個博士研究生至少一年的時間,而納赫曼認為,這一過程可以完成得更快、更徹底。

  有研究者提出了CWoLa算法,即無標簽分類(Classification Without Labels),可以搜索任意未知粒子的現有數據,無論該粒子是衰變成兩個同類型未知粒子,還是兩個同類型或不同類型已知粒子。利用常規的搜索模型,LHC協作機構可能需要至少20年時間來尋找后一種情況的可能性,而目前對前一種情況的搜索仍沒有任何結果。參與ATLAS項目的納赫曼表示,CWoLa算法可以一次完成所有這些工作。

  其他實驗粒子物理學家也認為,這將是一個很有價值的項目。在ATLAS項目中搜尋新粒子碰撞的物理學家凱特·帕查爾(Kate Pachal)說:“我們已經分析了許多可預測的區域,因此接下來我們要開始填補那些尚未分析的角落,這是很重要的一個方向。”去年,她和一些同事就在嘗試設計一種靈活的軟件,對一系列不同質量的粒子進行處理,但他們中沒有人對機器學習有足夠的了解。“我想現在是嘗試一下的時候了,”帕查爾說道。

  深度神經網絡有希望在不利于目前建模工作的數據中發現微妙的相關性。其他機器學習技術已經成功提高了LHC進行特定任務的效率,比如識別由底夸克粒子產生的“噴注”。在這項工作中,物理學家毫無疑問也會錯過一些信號。加州大學歐文分校的粒子物理學家丹尼爾·懷特森(Daniel Whiteson)說:“他們把信息遺留在桌面上,而當你在一個機器上花了100億美元,你不會想把信息留在桌子上。”

  不過,機器學習確實充滿了程序將手臂混淆為啞鈴的警示故事(甚至還有更糟糕的情況)。對于LHC,有人擔心機器學習的“捷徑”最終反映的是LHC機器本身的各種小問題,而這些問題正是實驗物理學家努力想要忽視的。ATLAS項目的物理學家蒂爾·艾費特(Till Eifert)問道:“當你發現一個異常時,你覺得它是新物理學突破呢,還是探測器發生了什么有意思的情況?”

文章排行榜更多
最近更新更多
325期p3试机号