亲,双击屏幕即可自动滚动
第136章 借你导师面子用用
    第136章 借你导师面子用用
    骆余馨是个懂得审时度势,更是个懂得如何抓住机会的人。起码在乔源看来这是骆余馨最大的优点。
    最大的缺点则是这女人过於不把自己当外人了。进他的房间跟进自己房间一样自然。
    乔源忍不住提醒了一句:“师姐,你房间是在隔壁呢。”
    “我知道啊,我是来看著你帮我把算法封装好,然后放伺服器上的。你还年轻还有时间挥霍,但我可已经老了。”
    骆余馨很自然地说道。
    “谁说你老了?”
    “你啊!上次你还说你妈不让你跟老女人谈恋爱。”
    果然女人都是记仇的!
    说出那句话到现在快半年了,这女人竟然还记得。
    “我那是开玩笑的,再说你不回去把设计好的算法给我,我怎么帮你验证?
    ”
    “你蠢还是我蠢?算法我放邮箱附件里了,直接用你的电脑登录我的邮箱下载不就行了?”
    乔源觉得不能再暗示了,这女人似乎听不懂他的潜台词。
    “但是这是我的房间啊。学姐,这大晚上的咱们俩单独在一个房间,万一被別人看到不好吧?尤其是你,还单身呢。”
    掏心掏肺的话换来的却是骆余馨的冷笑。
    “呦,现在你知道男女单处一室不好了?那在江大的时候,你为什么天天赖在我办公室里?那个时候你怎么不想著为我声誉著想了?”
    “我那是白天,而且那是行政楼的办公室,又不是寢室。”乔源据理力爭道。
    “第一,你晚上没去过我的办公室吗?好像通宵都有吧?第二,办公室跟寢室有什么区別吗?如果你有什么不轨之心,难道我还真能打得贏你?”
    依然字字句句都是道理,懟得乔源哑口无言。
    只能说去年他就不该图方便,借骆余馨的办公室用的。
    最终还是妥协,默默的打开了电脑,让骆余馨登录了邮箱。
    接下来的事情就简单了,乔源开始轻车熟路的布置环境,封装算法。
    骆余馨则半点不客气的搬了张凳子,坐到了乔源的身边,像个监工般盯著乔源做事。
    这让乔源略微有些不適,主要是稍微离得近了些。但没办法,他的笔记本电脑屏幕不大,离得太远的確看不清晰。
    於是乔源乾脆一边忙著搞定算法,一边隨口跟骆余馨聊了起来。
    “我打算听你的,趁著现在事情还不多,组织一个团队,设计一个人工智慧出来。”
    “挺不错的决定,那就儘快做计划唄。你什么时候能把项目策划书做出来?”
    乔源隨便问了一句,倒是让骆余馨变得积极起来。
    “项目策划书?”乔源愣了愣。
    “不然呢?首先你要確定做一个什么样的人工智慧吧?智能驾驶?语言大模型?又或者其他类型,简单来说就是你的业务目標。
    確定之后你要有个目標吧?比如成功指標是多少?准確率,召回率,响应时间,单位请求成本————
    接下来就说技术选择了,你是要传统式的ml,还是要做生成式的ai?
    这些都確定之后你才知道团队需要些什么人吧?比如做大模型你起码需要找算法工程师做结构吧?需要数据工程师构建训练集——.
    然后根据这些大概算出需要多少研发资金。总不能你嘴巴一张一合,就把人工智慧做出来了吧?”
    虽然骆余馨的话不好听,但乔源还是感觉很惊异。
    今天来了京城之后,不管是华清那边的袁老,还是陆院士、谭教授,明显都希望他儘快投入到数学研究之中。
    他本以为自己提到这个事情,骆余馨也会持反对的態度。毕竟真要做这个,肯定会延缓目前课题的研究进度。
    但没想到这女人竟然比他还激进。在他说出教授们看来肯定不太正確的想法之后,就给出一堆的建议。
    於是乔源狐疑的问道:“你觉得我的想法可行?”
    骆余馨歪著脑袋看著乔源,说道:“你想做就做唄。陆院士都让你叫老师了,这种机会你还不赶紧把握住?
    当然首先你要明確自己到底想要做什么,如果你压根就没有计划只是突然脑子一热,我觉得还是先老老实实上课吧。”
    乔源一边熟练的操作著电脑对骆余馨的算法封装,一边认真的介绍道:“目標很明確,我想做一个学术智能助手。
    框架肯定是要做的,平日里主要给它餵各种文献。目標是能够快速的从文海中找到有价值的文献。
    所以不止是准確跟速度,更需要它具备一定的学术审美跟学术分辨能力。
    这就包括了能识別创新性、评估严谨性的同时能够自动生成高质量摘要。
    所以你说的成功指標大概就是我的满意度,还有推荐列表排序的综合质量。
    嗯,或者再加一个惊喜发现率?
    比如能在arxiv这种预发表网站上,找出之前没有发现的,却极具创新意识的高价值论文。”
    话音落下,乔源久久没等到身边女人的回应。
    趁著操作间隙下意识的扭头看了眼,直接被嚇了一跳——————
    这才发现骆学姐正歪著脑袋死死的盯著他,关键距离他大概就一个拳头距离。
    “怎么了?”乔源下意识的向后躲了躲,隨后问了句。
    “没什么,我就想观察下你是不是认真的?”骆余馨凑在他面前说道。
    “当然是认真的。磨刀不误砍柴工啊。”乔源答了句。
    “如果真能做出这样的人工智慧,那可就逆天了。甚至以后期刊都不需要审稿人,你的这个ai都可以审稿了!”
    骆余馨说道。
    乔源想了想,然后突然笑了。
    “还记得不?上次我接受採访吐槽了懂乎。然后懂乎的一个经理打电话说我提交的认证审核信息不知道什么原因被ai否了。
    所以哪可能这么厉害?创新的理论需要新的范式。我们最多也只能拿已有论文去训练。
    创新的论文往往会有新的框架跟理论体系。所以用这玩意儿来审稿肯定是不行的。
    我只是希望它能把那些很水的论文给分辨出来。从庞杂的文献库里找出真正有用的论文。”
    骆余馨点了点头,隨后狐疑的看向乔源,问道:“目標这么明確说明你仔细考虑过了?聊聊?”
    乔源点了点头,说道:“的確想过一些。首先核心检索层,我觉得可以施加一个语义扩散噪声,首先用嵌入式模型把论文映射到向量空间。
    不一样的地方在於它不是直接检索最接近的东西。而是在向量空间里进行语义的隨机游走。
    比如我让它找几何分析的创新论文,它会有一个思维扩散,偏微分方程、信息几何甚至拓扑量子场等等各个区域都会同步检索。”
    骆余馨点了点头,立刻开口追问道:“找到了,然后呢?如何实现所谓的学术审美?”
    “哎————”
    乔源嘆了口气,才开口说道:“的確想过一些,不过都是些不太成熟的想法。”
    “比如训练模型的时候除了基础的论文指標,比如引用量、期刊声望加成等等这些,再增加一个反共性的识別器。
    给一些引用量不高,但方法新颖,又或者爭议很大思想超前的文献增加权重?
    至於论文过滤这块,需要这个人工智慧不止判断对错,还要识別价值。这的確挺难。
    这需要ai能够对比跟计算已知结论的复杂表述比例,可以检测符號滥用,以及拥有论证链冗余度分析的能力————
    我知道这系统挺复杂的,所以就是想试试而已。但万一成功了,以后可就方便多了。”
    骆余馨建议道:“不如直接跟微软合作?你知道微软的lean不?这证明器他们做了十多年了。”
    这显然是有的放矢。
    毕竟乔源是微软求而不得的男人,还有对面大人物的联繫方式。肯定有得聊。
    乔源摇了摇头,说道:“还是算了吧。我跟微软不熟,真要合作很麻烦。
    而且有这个想法后我专门去了解过lean。其实我的思路跟微软完全不一样。
    他们的lean严格意义上来说是做减法。把数学模糊的部分全部去掉,只留下逻辑骨架。
    我要设计的ai则是需要它能理解论文作者的直觉跟思想脉络。当然证明过程也是需要考虑的————算了,我直接跟你说数学命题吧。
    一个由数学文献构成的拓扑空间k,对於任意给定的研究前沿子流形m,总存在一个唯一的最有噪声分布η*,使得沿著由η*生成的隨机路径,首次击中一个更高维度的创新子流形m“的期望时间最小化。
    也就是————咦,这里竟然没有黑板。”
    乔源说著说著,就想直接把他脑子里浮现出的公式给写下来。
    可惜了这里不是江大的办公室。
    骆余馨隨手从兜里掏出了一支笔递给了乔源。
    乔源接过笔,直接拿起桌上的一个本子,写下了一串公式。
    “我觉得可以让η的强度σ*由知识空间k在m处的曲率张量r和研究者的认知函数f共同决定。
    当然这个函数的关係我还没想好。不过可以等ai著手设计之后再考虑这些。”
    说完,乔源看向骆余馨问道:“是不是有点异想天开了?”
    骆余馨没直接回答这个问题,而是反问道:“你怎么想到的?”
    乔源答道:“有为雅典娜的凝视项目。我觉得既然分布优化系统最终会收敛到最优解分布。
    那么设计一个系统在叠代海量文献过程中,內部价值判断標准应该也能收敛到一个稳定状態。
    无非就是要找到一个绝佳的平衡点。既然能搞定雅典娜的凝视,没道理做不出这样一个ai。
    当然效果如何我现在也不敢保证。不过我觉得可以尝试一下。哪怕效果不及预期,应该也能有所帮助。”
    “咻————”
    骆余馨撮唇吹了声口哨,气流拂面而过,好在很有温度,不像外面的西北风那般割人,还挺舒服。
    乔源一脸莫名其妙的看著这女人,毕竟当一个女人比男人更会耍流氓的时候,多少会让当事人感觉有些不適。
    “干了,如果真有用,那我以后可就轻鬆了。相当於有一个团队帮忙搜索文献。”
    听到这句话,乔源点了点头,刚想开口,又被这女人打断。
    “不过第一步还得你落实。首先你得定义一个价值吧?把你所谓的学术美感或者说学术价值做一个数学模型出来。
    如果真像你说的,要让模型能有学术审美,这个模型可就有点复杂了。相当於定义一个思想熵,嘖嘖————
    从这个角度来说,你这个思想熵还能衡量一篇论文能在多大程度上打破当前学术领域的认知均衡。
    这很不简单啊?乔源,你有这个信心没啊?”
    什么叫反客为主?
    这就是了!
    乔源盯著骆余馨半晌,都没搞清楚这女人怎么如此丝滑的对他发號施令了!
    需要免费给他打十年工的好像是这位学姐才对。
    虽然这个最核心的问题肯定还是需要他来解决。但起码应该由他来分配任务。
    “咳咳————骆学姐————”
    “不用说了,我懂。让我想想啊,首先你需要一个助手,然后我们需要一个算法工程师团队。
    你要做知识结构流形,就还得有做微分几何跟拓扑学研究的专家。回头我去博后流动站找几个人。
    涉及到fokker—planck方程及其稳態解,需要隨机分析跟懂统计物理的研究员。这些人估计得去找相关教授。
    另外还需要数据工程师构建跟管理训练数据集。最后就是搞自然语言处理跟表示学习的算法工程师了。这部分可以直接找几个研究生来做,直接去找他们的导师借。
    这么算下来,加上还要考虑到效率的话,我们大概需要组建一个十五到二十人左右的团队来实现你的想法。
    接下来我去帮你组建团队吧。毕竟你在这里人生地不熟的,也不认得几个人。”
    乔源沉默地点了点头。
    虽然这女人似乎有点反客为主上癮了,但毫无疑问的是,这个安排很合理。
    “你別光点头啊。我可没那么大的面子。你得把你家老师面子借我用用。”