字体
关灯
   存书签 书架管理 返回目录
    穿过北疆科大的校门,越过两栋教学楼,实验室里,李泽和姜伊伊安安静静地坐在门口的位置。
    虽然是周末,但吴晓忠的实验室却没有休息。
    “老师,这次我只微调了150个参数,可这任务卡在99%已经两天了,咱们实验室的算力什么时候能增加一些?”
    吴晓忠的学生王楠在一旁抱怨道。
    他也不想周末泡在实验室,可手里的任务一直在延迟,倒不是他代码写的慢,而是实验室的算力实在是不够用。
    吴晓忠主攻的就是AI大模型,之前接受李泽的投资,大模型研发有了长足的进展。
    甚至已经有了很多成果落地。
    可在继续迭代的过程又遇到了问题,数据工程、架构创新等基础都已经做到极致。
    可问题就出现在调参训练上,实验室的硬件有限,每次跑任务都要等上几天。
    写代码只要一小时,可等任务却超过了3天。
    吴晓忠的大模型在这样的效率下,不仅没有掉出第一梯队,还能跟上世界先进水平,已经很不容易了。
    要知道,现在的大模型动不动就上亿级别的参数,每次只优化几百个,这效率可想而知。
    “困难总是有的,想办法克服就是了,等熬过这一段时间,一切都会好的。”
    吴晓忠出言安慰道。
    他也不是没做出改变,模型架构已经优化到极致,kv缓存压缩至十分之一,长上下文显存占用降低90%。
    分布式、无辅助损失负载均衡、双向流水线,能想到的都想到了,可问题是底层的硬件底座不够给力。
    用的显卡是几年前的旧款,数量和质量都不尽如意,也不是他不想更新。
    实在是丑国封杀得严,高端显卡禁运,吴晓忠想买也买不到。
    想订购国内最新款自研显卡,可是产能又不够,那些大公司都吃不饱,他一个小实验室想抢到训练用的显卡太难了。
    无奈,只能用时间来换,争取每次调参的代码准确性高一些,避免出现返工的问题。
    又查看了几个学生的任务,吴晓忠慢慢走到李泽的身前。
    这是他第二次见李泽,上次还是在海浪汽车的厂里,测试自动驾驶模型的时候。
    他对李泽的印象很深,是个聪明孩子,而且还是李尚海的儿子,大家都亲切地称呼李泽为小李总。
    “小李总,今天怎么有空来这里玩,是不是想提前感受一下大学的氛围?”
    “吴教授,我这

关闭+畅/阅读=模式,看最新完整内容。本章未完,请点击下一页继续阅读》》
上一章 目录 下一页