• 范畴学习诱导神经几何的信息论研究

    - 本文采用信息论方法来评估类别学习所引发的神经表示的效率。 - 最小化编码成本意味着最大化类别和神经活动之间的互信息。 - 通过分析神经费舍尔信息,我们发现类别学习在决策边界附近引发了神经空间的扩展。 - 数值实验表明,编码神经群体的费舍尔信息与类别边界相一致。 - 通过最小化编码成本和最大化互信息,类别学习导致了神经空间的扩展和度量的改变。 - 通过数值实验,我们展示了学习如何改变编码神经活动的度量。 - 通过最小化平均贝叶斯成本,我们可以将相关贝叶斯成本分解为编码部分和解码部分。 - 最小化解码成本意味着选择最佳的解码器来提供对类别的最佳估计。 - 最小化编码成本意味着最大化神经活动与类别成员资格之间的互信息。 - 通过分析神经活动和类别之间的互信息,我们可以找到适当的表示空间和度量方式。 - 类别学习导致了决策边界附近神经空间的扩展。 - 数值实验表明,学习如何改变编码神经群体的费舍尔信息,使其与类别边界相一致。

    2023-11-28 12:52:17 +0800

  • 目的:提高健康知识与更好的健康结果有关;然而,很少对干预措施进行研究。我们调查了大型语言模型(LLM)是否可以作为提高儿童和其他人群健康素养的媒介。

    2023-11-18 08:23:37 +0800

  • Hiformer:推荐系统的异构特征交互学习

    - 提出了基于Transformer架构的Hiformer模型,用于自动捕捉特征交互。 - Transformer架构在自然语言处理和计算机视觉等领域取得了巨大成功。 - Hiformer模型通过引入异构自注意力层来解决Transformer架构在自注意力层中无法捕捉异构特征交互的问题。 - Hiformer模型通过低秩逼近和模型修剪实现了快速推理,适用于在线部署。 - 在Google Play的实际应用中,Hiformer模型在关键参与度指标上取得了显著提升(高达+2.66%)。

    2023-11-18 04:53:40 +0800

  • SiRA:低秩适应的稀疏混合

    - 网站huggingface.co无法访问 - 网站响应时间过长

    2023-11-18 04:53:41 +0800

  • EDMSound:用于高效高质量音频合成的基于频谱图的扩散模型

    2023-11-18 04:53:41 +0800

  • 本卷包含2023年11月15日和16日举行的第五届自治系统正式方法国际研讨会(FMAS 2023)的会议记录。FMAS 2023与莱顿大学莱顿高级计算机科学研究所组织的第18届国际集成形式方法会议(iFM)(iFM'22)共同举办。研讨会本身在Scheltema Leiden举行,这是一家位于运河边的19世纪毛毯厂,经过翻新。

    2023-11-18 01:30:55 +0800

  • 生成型大型语言模型(LLM)在各种NLP任务中取得了显著的进步。在这项工作中,我们的目标是通过使用机器翻译作为涉及英语和22种印度语言的任务来探索大型语言模型的多语言能力。我们首先研究了原始大型语言模型的翻译能力,然后探索了相同原始模型的上下文学习能力。我们使用参数有效的微调方法(如LoRA)对这些大型语言模型进行微调,此外还使用完全微调。通过我们的研究,我们已经为涉及LLM的翻译任务确定了性能最好的大型语言模型,该模型基于LLaMA。

    2023-11-18 01:30:55 +0800

  • Llamas知道GPT没有显示什么:置信度估计的代理模型

    2023-11-18 01:30:57 +0800

  • 解开混沌语境的思路

    2023-11-18 01:30:57 +0800

  • UT5:带展开去噪的预训练非自回归T5

    2023-11-18 01:30:58 +0800

2024 © 奇绩创坛 MiraclePlus