学霸的模拟器系统第113节

　　他的声音因为激动而拔高，在空旷的办公室里回响。

　　“我就是要用最极端的实验条件，去摧毁他们那个所谓‘优美’理论的根基！我要告诉全世界，这个领域，最终还是由我们做实验的人说了算！”

　　“可是教授，我们在文章中没有披露故意引入杂质的事实，这有违学术道德……”

　　大卫还想劝说。

　　“闭嘴！”

　　乌萨尔粗暴地打断了他，“制备过程中都会有杂质，这不是事实吗？我们的杂质只是比正常情况高了一些罢了，我们不说，谁会知道这是人为添加的？

　　“你要是觉得不道德，可以离开我的课题组！”

　　大卫的脸上闪过一丝挣扎，但最终还是沉默了。

　　乌萨尔教授看着自己学生那副样子，不屑地哼了一声。

　　他径直坐回电脑前，打开了一个文档。

　　文档的标题，措辞极其尖锐，充满了煽动性——

　　《On the Fragility of Theoretically Predicted Quantum Anomalous Hall Effect in Graphene》

　　（《论石墨烯中理论预言的量子反常霍尔效应之脆弱性》）

　　乌萨尔在文章的“致谢”部分，特意加了一句：“感谢韩至渊教授课题组发表在PRL上的‘启发性’工作。”

　　然后，他没有丝毫犹豫，将这篇充满了火药味的文章，连同他们那些看似“推翻”了原理论的实验数据，直接上传到了预印本网站arXiv。

　　……

　　金陵大学，集训队宿舍。

　　林允宁告别里希特教授，婉拒了对方共进晚餐的邀请，回到了自己的座位上。

　　他在Google Scholar的搜索框里，好奇地敲下了“Neural Network”两个单词。

　　屏幕上，立刻跳出了密密麻麻的相关论文。

　　他随意点开一篇综述，快速地浏览了一遍，立刻被里面的内容所吸引了。

　　一个简单的神经网络，只是通过学习大量的图片，便最终能够准确地区分出‘猫’和‘狗’，甚至还能识别各种手写字母和数字。

　　林允宁靠在椅背上，若有所思。

　　显然，神经网络是个很强大的工具，但里希特教授的RTN问题，是一个时域信号的难题，单纯用神经网络来处理，不经过信号转换，很难去识别统计规律。

　　他“识别模式”的思路没错，只是算法模型的选择上，还需要继续考虑。

　　林允宁叹了口气，刚要关闭综述页面，却忽然想起来一件事。

　　材料系高翔的那个高熵合金的“三色灯”项目，不也是一个典型的模式识别问题吗？

　　从一堆复杂的XRD数据和工艺参数中，自动判断出样品的“好”、“中”、“差”。

　　逻辑上来说，跟识别猫和狗并没有本质的区别。

　　一个新的念头，在他脑中清晰地浮现出来。

　　……

第104章物理信息神经网络（求收藏求追读求月票）

　　有了新的想法，林允宁立刻合上笔记本，抓起桌上的集训队图书卡，走向金陵大学图书馆。

　　高翔曾经跟他说过，在制备非平衡磁控溅射的多组分金属薄膜时，想找到一种方法，只用少量的XRD数据和几个简单的电学指标，就能快速判断样品是否落在了想要的目标相区。

　　当时，林允宁给了他一个用贝叶斯框架搭建的，用红、黄、绿三色灯判断样品相区的构思。

　　只是，他还没来得及实现，就被雅努斯计划吸引了全部注意力，将这个课题搁置了。

　　如今看来，用神经网络来处理这个问题，可能比贝叶斯模型更高效。

　　“三色灯”项目，本质上是一个分类问题，与识别猫狗并无二致。

　　而里希特教授的随机电报噪声（RTN），则是一个更复杂的时域信号识别问题。

　　两者有一定的共通之处，也许能用相似的方法论来解决。

　　林允宁决定先从简单一些的“三色灯”项目开始做起，积累了经验，再推广到RTN问题中。

　　雅努斯计划的实验验证部分，他目前毫无思路，只能先做其他课题，慢慢寻找灵感。

　　图书馆，计算机科学阅览区。

　　林允宁在高大的书架间穿行，最终抽出了两本厚重的英文影印书：

　　克里斯托弗·毕晓普的《模式识别与机器学习》和Haykin的《神经网络（第二版）》。

　　回到宿舍，他快速翻阅着那两本书。

　　感知机、反向传播、梯度下降……这些在十几年后烂大街的概念，在2005年的此刻，对绝大多数人而言还如同天书。

　　但对林允宁来说，这套逻辑清晰的数学框架并不难理解。

　　【检测到你已完成对《模式识别与机器学习》的首次通读，该知识模块已成功收录！】

　　【新知识模块：机器学习 LV.1概念认知】

　　林允宁没有犹豫，直接调动了系统。

　　【注入模拟时长：200小时！】

　　【指定模块：机器学习 LV.1 -> LV.2范式掌握！】

　　当模拟结束，林允宁睁开眼时，一个基础的神经网络框架已经在他脑中清晰成型。

　　他立刻打开电脑，开始用Python搭建一个最简单的三层全连接神经网络，加入到了Aether中，命名为Aether_ML_NN。

　　在【模拟科研】的帮助下，他很快完成了新模块的编写。

　　吃过午饭，他带着初步完成的Aether_ML_NN模块，来到了材料学院高翔的实验室。

　　实验室里还是一如既往，真空泵低沉地嗡鸣。

　　高翔的办公桌上还摆着两个泡面桶。

　　他看到林允宁，布满血丝的眼睛里亮起一丝期待。

　　“林师弟，你那边……”

　　“模型做好了，可以试试。”

　　林允宁将自己的笔记本电脑连接到高翔的工作站上，调出了一个简洁的界面，“我已经把你发给我的实验数据和对应的工艺参数，还有你对样品质量的‘好’、‘中’、‘差’的标记，全部导入了Aether进行训练。

　　“我现在需要更多的数据，进行交叉验证。”

　　高翔点了点头，立刻行动起来，将最近一个月的数据——十几份样品的XRD图谱和对应的溅射功率、气压、时间等参数，输入这个新模型。

　　“开始交叉验证。”

　　林允宁点下鼠标，进度条开始缓慢移动。

　　十分钟后，屏幕上弹出了一个分类准确率。

　　53.2%。

　　这个准确率，和闭着眼睛瞎猜也没什么区别。

　　实验室里一片安静。

　　高翔脸上的期待迅速褪去，最终化为一声无奈的叹息。

　　他摘下眼镜，用力揉了揉眉心，声音里带着实验人特有的疲惫：

　　“唉，我就知道没这么简单。机器学习这东西，在咱们这种小样本、高维度的材料科学里，可能真的不适用。”

　　他并没有抱怨，失败是科研的常态，他早已习惯。

　　林允宁却没说话，只是盯着屏幕上的混淆矩阵。

　　那上面显示，模型能轻易地区分出“好”和“差”的样品，却在“中等”和“良好”这两个最关键的区间，错得一塌糊涂。

　　为什么总在这两个区间犯错？

　　林允宁修长的手指轻轻敲击着桌面，很快有了结论。

　　从XRD图谱上看，这两个区间区别不大，峰型和峰位确实很像。

　　但神经网络只看到了相似性，却不知道实现两者的工艺参数，比如功率和气压，在物理意义上天差地别。

　　换句话说，问题不出在神经网络本身，而在于他给的“信息”不够。

　　“高师兄，”

　　林允愈抬起头，“我们得教它物理。”

　　“教它物理？”

　　高翔没听懂。

　　“对。它现在只会‘看’，不会‘理解’。”

　　林允宁指着屏幕，“我们得把溅射功率、气压这些工艺参数，不是作为普通数据，而是作为强约束的‘物理规则’，强行写进模型里。让它知道，功率提高1瓦，和气压改变1帕，对最终晶体结构的影响是完全不同的。”

　　一个全新的混合模型框架——“物理信息神经网络”（PINN），在他脑中成型。

　　【注入模拟时长：50小时！】

　　【模拟科研启动……】

　　【第15小时，你正在重构算法。你尝试将描述原子扩散和成核过程的Arrhenius方程，作为一个惩罚项，加入到神经网络的损失函数中。任何不符合该物理规律的参数预测，都会受到巨大惩罚。】

　　【第45小时你意识到，你正在创造一种全新的模型：不再是让机器去拟合物理，而是用物理去约束机器。】

　　现实中，林允宁的手指在键盘上翻飞。

　　一个小时后，Aether_ML_PINN_v1.0诞生了。

　　他重新导入数据，点击了“开始训练”。

　　这一次，模型不仅要拟合数据，还要满足物理规律的约束。

　　训练过程慢了很多，一直快到晚上吃饭的时候，才终于完成。

　　训练完成，高翔再次导入了那份测试数据。

首节上一节 113/509下一节尾节目录 txt下载

上一篇：影视：开局从同过窗开始进步！

下一篇：返回列表

学霸的模拟器系统 第113节

推荐阅读

学霸的模拟器系统第113节