- 20个问题游戏来区分大型语言模型。 | |
- 360PanT: 无需训练的文本驱动360度全景到全景翻译。 | |
- 3CSim:用于评估自动驾驶控制的CARLA角落案例模拟。 | |
- 3DFacePolicy:基于语音驱动的3D面部动画技术。 | |
- 479元!米家桌面学习灯pro开售:自带雷达感应、自适应调光 | |
- 60%参考文献被撤稿,Nature绷不住了 | |
- AI-LieDar:研究大型语言模型代理中效用与真实之间的权衡。 | |
- AIvril:基于人工智能的RTL生成与实时验证 | |
- AMBER -- 用于多波段图像分割的高级SegFormer:一种用于高光谱成像的应用。 | |
- ASFT:通过绝对似然进行对齐的监督微调。 | |
- AceParse: 一个包含多样化结构文本的全面数据集,用于学术文献解析。 | |
- AlignBot:通过微调将基于视觉语言模型的定制任务规划与用户提醒对齐,以便为家庭机器人提供服务。 | |
- AnyBipe:一个用于训练和部署双足机器人的全面框架,受大型语言模型引导。 | |
- Apollo:用于高质量音频修复的带序列建模 | |
- AraDiCE:针对大型语言模型的方言和文化能力的基准测试。 | |
- Arena 4.0:一个全面的ROS2开发和测试平台,用于基于生成模型的人本导航环境生成。 | |
- AutoPET挑战赛III:测试用于从全身PET/CT图像中分割FDG和PSMA病变的3D残差UNet的广义Dice焦点损失的鲁棒性。 | |
- AutoSafeCoder:一个多智能体框架,用于通过静态分析和模糊测试保障大语言模型代码生成的安全性。 | |
- B4: 优化可行代码解决方案和测试的评估 | |
- BEnDEM:一种基于引导去噪能量匹配的玻尔兹曼采样器。 | |
- CORE-Bench:通过计算可重复性评估提高发表研究的可信度 | |
- COSCO:一种针对少量样本多变量时间序列分类的敏锐度感知训练框架。 | |
- CPL: 关键规划步骤学习提升大型语言模型在推理任务中的泛化能力。 | |
- CSKV:用于长上下文场景的高效通道缩减的KV缓存训练方法 | |
- CVE-2023-48788 漏洞被利用:研究人员详细介绍了对 Fortinet EMS 的网络攻击。 | |
- ChatSUMO:用于自动生成城市交通场景的大型语言模型 | |
- Contrasformer:一种用于识别神经退行性疾病的脑网络对比变换器。 | |
- Contri(e)ve:针对学术问题回答的情境和检索。 | |
- CritiPrefill:一种基于段落重要性的预填充加速方法,用于大规模语言模型。 | |
- CyberNFT:构思一个基于去中心化和奖励驱动的机器学习入侵检测系统。 | |
- D2Vformer:一种基于时间位置嵌入的灵活时间序列预测模型。 | |
- D3-GNN:用于流式图神经网络的动态分布式数据流。 | |
- DAE-Fuse:一种自适应的区分自编码器用于多模态图像融合 | |
- DM:用于语音修复的双路径幅度网络 | |
- DPI-TTS:一种用于文本转语音的快速收敛和风格时间建模的方向性补丁交互方法。 | |
- DocMamba:基于状态空间模型的高效文档预训练 | |
- DrLLM:一种基于大语言模型的增强提示分布式拒绝服务抵抗方法。 | |
- DreamHead:通过层次扩散学习音频驱动的对话头像的时空对应关系 | |
- DynaMo: 视觉-运动控制领域的动态预训练。 | |
- E-QUARTIC:用于资源优化学习的能效边缘卷积神经网络集成。 | |
- E2Map: 基于语言模型的自我反思机器人导航体验与情感地图 | |
- E2MoCase:一个关于影响重大的法律案件新闻文章中情感、事件和道德观察的数据集。 | |
- EIA:针对通用网络代理的环境注入攻击,导致隐私泄露。 | |
- ELMS:移动设备上的弹性大型语言模型 | |
- ESPnet-EZ:仅使用Python的ESPnet,便于微调和整合。 | |
- ETAGE:通过集成熵和梯度范数实现增强的测试时间适应,以提高模型性能的稳健性。 | |
- ElasticAI:为广泛计算创建和部署节能深度学习加速器 | |
- Eureka:评估和理解大型基础模型 | |
- EventAug:用于事件学习的多种时空数据增强方法 | |
- ExploreSelf:通过大型语言模型提供自适应指导,支持用户对个人挑战进行探索和反思。 | |
- FGR-Net:基于深度重建学习的可解释眼底图像分级分类。 | |
- FTC的一项广泛研究发现社交媒体网站对用户进行“广泛监控”。 | |
- Famba-V:快速视觉骡子,采用跨层令牌融合。 | |
- FedNE:一种用于降维的代理辅助联邦邻域嵌入方法。 | |
- FedProphet:一种节省内存的联合对抗训练方法,基于理论稳健性和低不一致性级联学习。 | |
- FlexiTex:通过视觉指导提升纹理生成。 | |
- FoME:一种基于自适应时间-侧向注意力缩放的脑电图基础模型。 | |
- FoodPuzzle: 研发大型语言模型代理作为味觉科学家。 | |
- FreeMark: 一种无侵入的白盒深度神经网络水印技术 | |
- GCA-SUN:一种用于无需示例计数的上下文感知Swin-UNet模型。 | |
- GEIC: 使用大语言模型进行通用和多语言命名实体识别 | |
- GOSt-MT:一个针对与职业相关的机器翻译中的性别偏见的知识图谱。 | |
- GReDP:一种更强稳的差分隐私训练方法,通过减少保持梯度的噪声。 | |
- GUNet:一种结合图卷积网络的扩散模型,用于稳定和多样化的姿态生成。 | |
- GaRField++: 强化高斯辐射场用于大规模3D场景重建 | |
- GenCRF:生成聚类与重构框架,旨在增强基于意图的信息检索。 | |
- GlobalMapNet:一种在线全球高清地图矢量化构建框架 | |
- HALO:通过检索增强上下文优化大语言模型的幻觉分析和学习,以支持临床决策。 | |
- HARP:一种人类辅助的多智能体强化学习方法,使用不变性评价器进行重新分组。 | |
- HRA:一种多标准框架用于对元启发式优化算法进行排名 | |
- Hi-SLAM:通过分层类别高斯点云扩展SLAM中的语义信息。 | |
- HiFi-CS: 基于视觉-语言模型的开放词汇视觉定位,用于机器人抓取。 | |
- HyPA-RAG:一种混合参数自适应的检索增强生成系统,应用于人工智能法律和政策领域。 | |
- IMRL:整合视觉、物理、时间和几何表示以增强获取食物的能力。 | |
- ITPatch:一种隐形并可触发的物理对抗补丁,针对交通标志识别。 | |
- InfoDisent:通过信息解耦实现图像分类模型的可解释性。 | |
- InverseMeetInsert:通过引导扩散模型中的几何累积反演,实现稳健的真实图像编辑。 | |
- JourneyBench:一个具有挑战性的生成图像的视觉-语言理解基准测试。 | |
- KnowFormer:重新审视用于知识图谱推理的变换器 | |
- LACOSTE:利用立体和时间信息进行手术器械分割。 | |
- LLM-Agent-UMF:基于LLM的代理统一建模框架,实现多主动/被动核心代理的无缝集成。 | |
- LLM-DER:一种基于大型语言模型的中文煤化工领域命名实体识别方法。 | |
- LLMR: 通过大型语言模型引导的奖励进行知识蒸馏。 | |
- LMAC-TD:为音频分类器生成时间域解释。 | |
- LMT-Net:用于从稀疏车辆观测数据自动生成高清地图的车道模型变换网络。 | |
- LOLA -- 一个开源的多语言大型语言模型 | |
- MAISI:用于合成成像的医疗人工智能 | |
- MEOW:通过反转事实进行记忆监督的大型语言模型的学习遗忘。 | |
- MGSA:多粒度图结构注意力用于知识图谱到文本生成。 | |
- MMSearch:评估大型模型作为多模态搜索引擎的潜力 | |
- MOST:通过持续学习优化多任务下的磁共振重建。 | |
- MSDNet:一种通过变换器引导的原型技术进行少样本语义分割的多尺度解码器。 | |
- MURI:通过反向指令为低资源语言提供高质量的指导调优数据集。 | |
- Mamba Fusion:通过提问学习动作 | |
- Mamba和Transformer的结合——用于长短期时间序列预测的MAT,应用于气象动态。 | |
- MaskMol:用于活性悬崖的知识引导分子图像预训练框架。 | |
- MindGuard:通过边缘大语言模型实现无障碍、无污名的心理健康急救。 | |
- MindScape研究:结合大语言模型和行为感知,提供个性化的AI驱动日记体验。 | |
- MulCPred:学习多模态概念以进行可解释的行人动作预测。 | |
- MusicLIME:可解释的多模态音乐理解 | |
- NSSR-DIL:基于深度身份学习的无样本图像超分辨率。 | |
- NatureElectronics期刊发表加州大学圣地亚哥分校开发汗液驱动的可穿戴设备 | |
- NeSHFS:基于启发式特征选择的邻域搜索用于点击率预测。 | |
- NoPhish:高效的Chrome扩展,利用机器学习技术检测网络钓鱼。 | |
- OrthoDoc:用于辅助计算机断层扫描诊断的多模态大语言模型。 | |
- PAD-FT:一种轻量级的防御后门攻击的方法,通过数据净化和微调来实现。 | |
- PARAPHRASUS:评估意同句检测模型的全面基准。 | |
- PDMX:一个大规模公共领域的MusicXML音乐数据集,用于符号音乐处理。 | |
- PReLU:又一种解决异或问题的单层方法 | |
- PeriGuru:一个基于图像理解和大语言模型提示的外部设备机器人移动应用助手。 | |
- PersonaFlow:通过模拟专家角色,提高研究创意的工具。 | |
- Phikon-v2 是一个大型公共特征提取工具,用于生物标志物预测。 | |
- Playground v3:通过深度融合大语言模型提高文本与图像的对齐。 | |
- Point2Graph:一种基于点云的端到端3D开放词汇场景图,用于机器人导航。 | |
- ProSLM:一种结合了Prolog的语言模型,用于可解释的领域知识问答。 | |
- ProcessTBench:一个用于过程挖掘的LLM计划生成数据集。 | |
- Qwen2.5-Math技术报告:通过自我提升迈向数学专家模型 | |
- RAG-Modulo:使用经验、评论和语言模型解决顺序任务。 | |
- REG:改进的通用焦点损失,用于在泰国高速公路上利用视觉检测和分割模型进行道路资产检测。 | |
- ReflectDiffu:通过RL-Diffusion框架反映情感意图的传播与模仿,以生成共情响应。 | |
- SDP:适用于机器人操作的脉冲扩散策略,具有可学习的通道膜阈值。 | |
- SEAL:通过技能驱动的对抗学习实现安全的自动驾驶,以生成闭环场景。 | |
- SIFToM:通过心智理论实现稳健的口头指令跟随 | |
- SOAP:使用Adam改进和稳定洗发水 | |
- SRE-CNN:一种用于心脏动态核磁成像的时空旋转不变卷积神经网络。 | |
- SambaSpy RAT 针对意大利用户进行独特的恶意软件攻击。 | |
- SemAI:用于物联网的语义人工智能增强DNA存储。 | |
- SplatSim:使用高斯喷溅实现RGB操作策略的无监督现实转移。 | |
- StruEdit:结构化输出使大型语言模型的知识编辑快速而准确。 | |
- SuperCoder2.0:关于大型语言模型作为自主程序员可行性的技术报告 | |
- SurgPLAN++:通用手术阶段定位网络,用于在线和离线推理 | |
|