版的U-Net网络架构。
输入是标准DTI数据,输出是三维纤维定位坐标。
训练数据来自他们自建的一个脊髓标本数据库,总共五百多例。
网络经过训练之后,在测试集上报告了三十五微米的平均定位精度。
看上去数据很漂亮,但陆晨在读到训练数据描述的时候就发现了问题。
他们用来标注的组织学切片,分辨率是三十微米。
也就是说,训练数据本身的精度上限就是三十微米。
让一个网络从三十微米精度的标注数据里学出三十五微米的定位能力,这是合理的。
但你想让它学出二十微米甚至更高的精度,那就是在让网络凭空创造不存在的信息。
这在机器学习领域有一个名字,叫做信息瓶颈。
无论你的网络架构多复杂,训练策略多精巧,精度都不可能超过训练数据本身的分辨率。
……
陆晨继续往下看,又发现了第二个问题。
诺盛的模型在处理纤维交叉区域时表现明显下降。
他们的补充材料里有一张表格,展示了不同解剖区域的分项精度。
在直行纤维束区域,精度确实能达到三十四微米。
但在纤维交叉和分叉区域,精度骤降到了五十八微米。
而脊髓损伤的修复恰恰需要在纤维交叉最密集的区域进行精确操作。
五十八微米的精度在那种环境下根本不够用。
这是一个致命的短板。
陆晨把两个发现整理成了一份简洁的技术备忘录,总共不到两千字。
每一个论点都附了论文原文的截图和对应页码。
然后他把备忘录同时发给了方芷晴和宋怀远。
邮件标题是“诺盛预印本技术分析:不构成实质性威胁”。
发完邮件之后,他又花了半小时把备忘录中的结论翻译成了英文版本。
这个英文版本不是用来发表的,而是给方芷晴的专利律师准备的。
如果诺盛的PCT专利真的推进到实质审查阶段,这份技术分析可以作为对抗依据。
全部做完的时候已经是