科學家在一些用人工智能技術構建的神經網絡模擬宇宙系統中,也看到了這樣的現象——從單個星系的特性居然能推測出整個宇宙的組成結構。
宇宙學家通常需要研究盡可能多的星系、天體,才能更好地了解宇宙的組成結構。但是一些研究者發現他們近年開發的一個機器學習系統有著不一樣的研究能力:這個系統只需要探查其中一個模擬星系的特性,就能預測出它所在的整套模擬宇宙的組成結構。
換言之,這套系統總結出某種規律,可以幫助天文學家通過研究構建宇宙的基礎單元,探究整體宇宙的某些特性。
據《連線》(Wired)雜誌報導,這項研究的主要作者之一紐約Flatiron Institute的理論天體物理學家弗朗西斯科·維拉埃斯庫薩-納瓦羅(Francisco Villaescusa-Navarro)說:「這是一個全新的思路。不需要測量數百萬個星系,就看一個星系。這居然起作用,這太神奇了。」
這份論文1月6日發表在預印網arXiv,並已提交給同行評審。這個名為「基於機器學習模擬的宇宙學和天體物理學」(Cosmology and Astrophysics with Machine Learning Simulations,縮寫為CAMELS)項目,用機器學習算法模擬構建了2,000個數字宇宙。
這些模擬宇宙裡面物質和暗能量的比例不相同。物質所占的比例從10%~50%不等,其餘的成分為暗能量。這裡所說的物質包括普通可見物質和不可見的暗物質,暗能量則是科學家認為推動宇宙不斷膨脹的因素。科學家認為現實宇宙中三分之一的成分是可見物質和不可見的暗物質,另外三分之二是暗能量。
這些模擬宇宙啓動後能夠自動演化:暗物質和可見物質交織互動形成各個星系,還能看到宇宙中像超新星爆發、位於星系中心的超級黑洞向兩端發出噴射流等激烈的天文事件。
合作研究員普林斯頓大學(Princeton University)的學生居比特·丁(Jupiter Ding)接手一個任務,用機器學習算法構建一套神經網絡系統,用於研究這些模擬宇宙。這項任務本來只是一個機會讓居比特·丁熟悉機器學習算法。
所謂「神經網絡系統」是人工智能領域內的一個分支,用複雜的算法讓機器從海量的數據中找到規律。也就是說,這類系統在一定程度上具有人類大腦總結、思考的能力,所以這類系統被稱為「神經網絡」。現在各個科研領域都在使用這些系統,它們能夠幫助科研人員節省大量時間。科學家能夠在「神經網絡」得到的初步結果或有了某些新發現後,更有針對性地進行進一步研究。
這套系統有了新的發現。居比特·丁開發的神經網絡在研究了多個數字宇宙內近百萬個模擬星系後,居然發現,其實從每個星系的體積、組成結構、質量等十幾個特徵,就能推測出它所在的整套模擬宇宙的物質密度。
這個規律令人意外。於是研究人員再分析來自另外幾十個模擬宇宙內的幾千個星系。這幾十個模擬宇宙是這套神經網絡之前還沒有研究過的。研究人員用這套規律推測這些數字宇宙的物質密度,結果發現推測結果的誤差還不到10%。
研究組花了半年的時間調查這套神經網絡發現的規律。一開始他們懷疑也許是某些錯誤造成的。結果發現這種規律的確存在。他們還發現,星系各方面大約一共17個特性都與整個宇宙的物質密度相關。而且,這不會隨著星系的合併、恆星爆炸、黑洞噴發等各種演化過程的出現而改變。