字体
关灯
   存书签 书架管理 返回目录
搭乐高?这个说法很有意思,能具体解释一下吗?”
    顾超凡坐直了身子。
    “你看,乐高玩具的每一个模块,不管它是长条的、方形的还是圆形的,它的接口都是标准化的。我不需要知道这个塑料是怎么倒模出来的,我也不需要知道它的材料成分是什么。我只需要知道,我把这个模块插到那个模块上,它就能拼出一面墙,或者一辆车。”
    顾超凡越说越兴奋。
    “TensorFlow给我的感觉就是一盒超级强大的数字乐高。它把那些最复杂、最难懂的底层数学运算全都打包封装好了。我只需要调用它的API接口。”
    他用双手在空中模拟着连接的动作。
    “我要加一个卷积层,啪,调用一个模块;我要加一个池化层,啪,再加一个模块。这帮我屏蔽了所有的底层复杂性。”
    “而且每一个模块应该怎么样使用,在什么样的情况下使用,官方的文档里面,都给了比较详细的示例代码和教程。”
    苏晚晴看着他专注的表情,继续发问。
    “也就是说,你并不需要理解每一行底层代码的逻辑,也能完成顶尖模型的训练?”
    顾超凡非常坦诚地点头。
    “是的。外网那些大牛管这个叫深度学习前沿研究。我倒感觉这种操作像是‘炼丹’。”
    苏晚晴笑了出声。
    “炼丹?为什么这么叫?”
    顾超凡也跟着笑了起来。
    “因为很多时候,我也不完全确定为什么加了这一层,准确率就会提升。”
    “我就是在框架里不断地调整参数。”
    “改一改学习率,调一调批次大小,然后把数据喂进去跑。”
    “就像古代道士把药材扔进炼丹炉里,看看最后能炼出个什么东西来。”
    他收起笑容,语气变得认真。
    “但是,能够让我这样不断试错、不断‘炼丹’的前提,是这个丹炉必须足够好用。”
    “TensorFlow帮我处理了显存分配、跨硬件调用这些最麻烦的事情。如果让我自己去写CUDA代码来调度GPU,我估计写三年都写不出一个能跑的Demo。”
上一页 目录 下一章