坐在电脑前,听着喇叭里,传出的各种名词,我心里一阵发虚,有些后悔。
线上会议源于上次的拜访。那次拜访,一口气和李博士聊了四个小时,颇有相见恨晚之意。畅谈之后,我也没当回事。谁知,李博士当了真。昨天下午打电话约我时间,电话里很是客气。
“会哥,麻烦问下您明天有没有时间,参加线上会议,帮我们指导下,非常感谢。”
话说得客气,上次面谈又非常聊得来,不好拒绝,只有答应下来。
会议准时开始,李博士主持,依然非常客气,隆重地向他的团队介绍我。
“今天很荣幸邀请到会总,有丰富的工作经验,技术非常专业,大家欢迎。”
喇叭里传来一阵掌声,那边会场应该还是有几个人。
我深知捧得越高,摔得越痛的道理。李博士介绍之后,我只好谦虚地说:“非常荣幸,有这个学习交流的机会,感谢大家。”
技术人员小郭一开讲,我心里就发慌。绝大部分内容,都是我不曾接触过的知识。尤其是知识图谱,前几年炒得非常火热,那会儿跟着领导稍微了解下,根本没有深入研究,电脑上甚至没有安装对应软件。作为专家参会,最怕遇到专业技术人员,尤其是像小郭这种一线技术人员,很有可能提出非常具体的问题,不好回答。罗胖的六字真言——一具体,就深刻,到什么时候都有效。
脑子里一直在胡思乱想,几乎没怎么听小郭在讲什么。迷迷糊糊中,听到小郭说:“会总,我的汇报完毕。现在主要有两个问题,一个是我每次检索,只能搜索到一万个节点,全部图谱有两万个节点,检索不完整。另外一个,就是知识图谱页面渲染非常卡顿,显示两百多个节点,就卡得不行,几乎没法用。”
越怕什么,越来什么。软件行业,能做出来是一回事,做出来可以运行很稳定又是另外一回事。相对来说,做软件不难,难的是调优。现在小郭问的问题正是调优,对我一个都没安装过知识图谱软件的人来说,应该是一个大难题。不懂又不能乱说,关键是还不能冷场。我脑子里迅速转了几圈,马上得出结论,我没有知识图谱的相关知识,只有用类比的方法来讲。略微迟疑几秒,我润了润嗓子,壮一壮胆,打开话筒。
“小郭,是这样。你现在用的这个知识图谱软件,我确实没有用过。不过,对你这两个问题,我有一些建议。首先是第一个问题,我先问下,你的服务器是单机还是集群?”
“单机,就是一台服务器。”
听到单机服务器,我像是抓住一根救命稻草,瞬间有了发挥空间。
“小郭,很有可能是单机服务器的原因。为什么呢,因为我们都知道按照现在64位的规则计算,单台服务器的内存寻址空间只有128gb,最多只有这么多。两万多个节点的知识图谱,应该也不算小了。我建议你们换成集群服务器,同时采用分布式存储和分布式计算,这样的话,应该能够解决问题。”
原来我做过数字化转型的产品研发,刚好也经历过海量数据计算,当时就是遇到单机服务器算力资源有限,容易崩溃的问题,我直接移花接木,拿来回答效果的问题。
“会总,麻烦问下,什么是分布式存储,需不需要每台电脑都要把资料存一份呢?”
听到小郭问分布式存储,我心里一下轻松很多,总算遇到他不懂的领域。我又用打比方的方式,给小郭科普了下分布式存储,直到听到小郭再三感谢后,我又开始回答第二个问题。
“关于知识图谱显示问题,我建议做一些分级优化,比如我们的瓦片地图,分为十九或者二十二级。在第一级,范围极大的时候,只显示重要的名称,你比如某德地图,显示全球范围时,可能只显示几大洲,几大洋,放大到某个州,才显示国家名称,逐级细分。另外,关于知识图谱的显示,更重要的是要有触发显示,比如点到哪个节点,才显示对应的实体与关系,而不是一直都是全部显示。”
我又把网络地图开发的一套理论,拿来套壳,做一番说明。刚说完,那头李博士插话进来:“是这样的,会总的意思,我明白了。感谢感谢。”
接下来,又围绕文档切片、知识提取、处理和入库展开一系列的讨论,作为门外汉,我只能用移花接木的方式参与讨论,好在没有过多地穿帮。
一直到中午十二点,会议终于结束。我长出了一口气,专家也不好当啊。












网友评论