学霸的模拟器系统 第113节
他的声音因为激动而拔高,在空旷的办公室里回响。
“我就是要用最极端的实验条件,去摧毁他们那个所谓‘优美’理论的根基!我要告诉全世界,这个领域,最终还是由我们做实验的人说了算!”
“可是教授,我们在文章中没有披露故意引入杂质的事实,这有违学术道德……”
大卫还想劝说。
“闭嘴!”
乌萨尔粗暴地打断了他,“制备过程中都会有杂质,这不是事实吗?我们的杂质只是比正常情况高了一些罢了,我们不说,谁会知道这是人为添加的?
“你要是觉得不道德,可以离开我的课题组!”
大卫的脸上闪过一丝挣扎,但最终还是沉默了。
乌萨尔教授看着自己学生那副样子,不屑地哼了一声。
他径直坐回电脑前,打开了一个文档。
文档的标题,措辞极其尖锐,充满了煽动性——
《On the Fragility of Theoretically Predicted Quantum Anomalous Hall Effect in Graphene》
(《论石墨烯中理论预言的量子反常霍尔效应之脆弱性》)
乌萨尔在文章的“致谢”部分,特意加了一句:“感谢韩至渊教授课题组发表在PRL上的‘启发性’工作。”
然后,他没有丝毫犹豫,将这篇充满了火药味的文章,连同他们那些看似“推翻”了原理论的实验数据,直接上传到了预印本网站arXiv。
……
金陵大学,集训队宿舍。
林允宁告别里希特教授,婉拒了对方共进晚餐的邀请,回到了自己的座位上。
他在Google Scholar的搜索框里,好奇地敲下了“Neural Network”两个单词。
屏幕上,立刻跳出了密密麻麻的相关论文。
他随意点开一篇综述,快速地浏览了一遍,立刻被里面的内容所吸引了。
一个简单的神经网络,只是通过学习大量的图片,便最终能够准确地区分出‘猫’和‘狗’,甚至还能识别各种手写字母和数字。
林允宁靠在椅背上,若有所思。
显然,神经网络是个很强大的工具,但里希特教授的RTN问题,是一个时域信号的难题,单纯用神经网络来处理,不经过信号转换,很难去识别统计规律。
他“识别模式”的思路没错,只是算法模型的选择上,还需要继续考虑。
林允宁叹了口气,刚要关闭综述页面,却忽然想起来一件事。
材料系高翔的那个高熵合金的“三色灯”项目,不也是一个典型的模式识别问题吗?
从一堆复杂的XRD数据和工艺参数中,自动判断出样品的“好”、“中”、“差”。
逻辑上来说,跟识别猫和狗并没有本质的区别。
一个新的念头,在他脑中清晰地浮现出来。
……
第104章 物理信息神经网络(求收藏求追读求月票)
有了新的想法,林允宁立刻合上笔记本,抓起桌上的集训队图书卡,走向金陵大学图书馆。
高翔曾经跟他说过,在制备非平衡磁控溅射的多组分金属薄膜时,想找到一种方法,只用少量的XRD数据和几个简单的电学指标,就能快速判断样品是否落在了想要的目标相区。
当时,林允宁给了他一个用贝叶斯框架搭建的,用红、黄、绿三色灯判断样品相区的构思。
只是,他还没来得及实现,就被雅努斯计划吸引了全部注意力,将这个课题搁置了。
如今看来,用神经网络来处理这个问题,可能比贝叶斯模型更高效。
“三色灯”项目,本质上是一个分类问题,与识别猫狗并无二致。
而里希特教授的随机电报噪声(RTN),则是一个更复杂的时域信号识别问题。
两者有一定的共通之处,也许能用相似的方法论来解决。
林允宁决定先从简单一些的“三色灯”项目开始做起,积累了经验,再推广到RTN问题中。
雅努斯计划的实验验证部分,他目前毫无思路,只能先做其他课题,慢慢寻找灵感。
图书馆,计算机科学阅览区。
林允宁在高大的书架间穿行,最终抽出了两本厚重的英文影印书:
克里斯托弗·毕晓普的《模式识别与机器学习》和Haykin的《神经网络(第二版)》。
回到宿舍,他快速翻阅着那两本书。
感知机、反向传播、梯度下降……这些在十几年后烂大街的概念,在2005年的此刻,对绝大多数人而言还如同天书。
但对林允宁来说,这套逻辑清晰的数学框架并不难理解。
【检测到你已完成对《模式识别与机器学习》的首次通读,该知识模块已成功收录!】
【新知识模块:机器学习 LV.1概念认知】
林允宁没有犹豫,直接调动了系统。
【注入模拟时长:200小时!】
【指定模块:机器学习 LV.1 -> LV.2范式掌握!】
当模拟结束,林允宁睁开眼时,一个基础的神经网络框架已经在他脑中清晰成型。
他立刻打开电脑,开始用Python搭建一个最简单的三层全连接神经网络,加入到了Aether中,命名为Aether_ML_NN。
在【模拟科研】的帮助下,他很快完成了新模块的编写。
吃过午饭,他带着初步完成的Aether_ML_NN模块,来到了材料学院高翔的实验室。
实验室里还是一如既往,真空泵低沉地嗡鸣。
高翔的办公桌上还摆着两个泡面桶。
他看到林允宁,布满血丝的眼睛里亮起一丝期待。
“林师弟,你那边……”
“模型做好了,可以试试。”
林允宁将自己的笔记本电脑连接到高翔的工作站上,调出了一个简洁的界面,“我已经把你发给我的实验数据和对应的工艺参数,还有你对样品质量的‘好’、‘中’、‘差’的标记,全部导入了Aether进行训练。
“我现在需要更多的数据,进行交叉验证。”
高翔点了点头,立刻行动起来,将最近一个月的数据——十几份样品的XRD图谱和对应的溅射功率、气压、时间等参数,输入这个新模型。
“开始交叉验证。”
林允宁点下鼠标,进度条开始缓慢移动。
十分钟后,屏幕上弹出了一个分类准确率。
53.2%。
这个准确率,和闭着眼睛瞎猜也没什么区别。
实验室里一片安静。
高翔脸上的期待迅速褪去,最终化为一声无奈的叹息。
他摘下眼镜,用力揉了揉眉心,声音里带着实验人特有的疲惫:
“唉,我就知道没这么简单。机器学习这东西,在咱们这种小样本、高维度的材料科学里,可能真的不适用。”
他并没有抱怨,失败是科研的常态,他早已习惯。
林允宁却没说话,只是盯着屏幕上的混淆矩阵。
那上面显示,模型能轻易地区分出“好”和“差”的样品,却在“中等”和“良好”这两个最关键的区间,错得一塌糊涂。
为什么总在这两个区间犯错?
林允宁修长的手指轻轻敲击着桌面,很快有了结论。
从XRD图谱上看,这两个区间区别不大,峰型和峰位确实很像。
但神经网络只看到了相似性,却不知道实现两者的工艺参数,比如功率和气压,在物理意义上天差地别。
换句话说,问题不出在神经网络本身,而在于他给的“信息”不够。
“高师兄,”
林允愈抬起头,“我们得教它物理。”
“教它物理?”
高翔没听懂。
“对。它现在只会‘看’,不会‘理解’。”
林允宁指着屏幕,“我们得把溅射功率、气压这些工艺参数,不是作为普通数据,而是作为强约束的‘物理规则’,强行写进模型里。让它知道,功率提高1瓦,和气压改变1帕,对最终晶体结构的影响是完全不同的。”
一个全新的混合模型框架——“物理信息神经网络”(PINN),在他脑中成型。
【注入模拟时长:50小时!】
【模拟科研启动……】
【第15小时,你正在重构算法。你尝试将描述原子扩散和成核过程的Arrhenius方程,作为一个惩罚项,加入到神经网络的损失函数中。任何不符合该物理规律的参数预测,都会受到巨大惩罚。】
【第45小时你意识到,你正在创造一种全新的模型:不再是让机器去拟合物理,而是用物理去约束机器。】
现实中,林允宁的手指在键盘上翻飞。
一个小时后,Aether_ML_PINN_v1.0诞生了。
他重新导入数据,点击了“开始训练”。
这一次,模型不仅要拟合数据,还要满足物理规律的约束。
训练过程慢了很多,一直快到晚上吃饭的时候,才终于完成。
训练完成,高翔再次导入了那份测试数据。
上一篇:影视:开局从同过窗开始进步!
下一篇:返回列表
