该项目使用了一种名为句子嵌入的简单对比学习(SimCSE)的自然语言处理模型。SimCSE是一个高性能模型,它创建向量表示*1来掌握文档和其他文本的含义。该模型能够计算不同文本之间的高精度语义相似度,有望在信息检索和问答系统等领域得到应用。
对于这个项目,两家公司将基于专利数据库对SimCSE模型进行预培训,以矢量化专利数据文档,从而可以高精度地找到类似的专利。这些公司已经成功地利用张量网络*2技术对SimCSE模型的数据进行了高效压缩。
该模型有望在专利检索和三井化学产品新应用的搜索等领域得到实际应用。
拓展阅读:
三井化学复合塑料有限公司