在上一篇文章中讲神经网络里的损失函数的时候,我发现有三个基本的思路。在上一篇文章中其实是介绍了最小二乘法和极大似然估计法,可是没有想到我自己用极大似然估计法推出来的那个损失函数,在很多人看来那似乎是交叉熵,我就产生了好奇,交叉熵到底是什么呢?
AI生成的图像上一篇文章中我们使用Softmax Loss损失函数微调训练了第一个Sentence Transformers模型,本文我们将使用性能更好的Multiple Negatives Ranking Loss(多负样本排列损失)函数来学习微调训练性能更好的Sentence
燕山大学信息科学与工程学院, 河北 秦皇岛 066004;LIU Shuai, LI Xiaoying, YU Meng, et al. Dual decoupling semantic segmentation model for high-resolution remote sensing images. Acta Geodaetica et Cartographica Sinica, 2023, 52: 638-647. DOI: 10.11947/j.AGCS.2023.20210455。