让天下没有难Tuning的大模型-PEFT技术简介

最近,深度学习的研究中出现了许多大型预训练模型,例如GPT-3、BERT等,这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中,ChatGPT模型因…

程序员系统入门大模型的路径和资源,看这篇就够了

本篇文章面向对大模型领域感兴趣,又不知如何下嘴的程序员。
看一下围绕大模型的应用场景和人才需求:

Prompt工程:
基于提示词对大模型的使用,会问问题就行。…

关于垂类场景下RAG 的思考

写在前面
今天这篇文章不是分享某个技术点也不是分享论文,而是笔者抛砖引玉的提出一些垂类下关于RAG 的瓶颈和一些思考,然后广发英雄帖,感兴趣的读者都可以加入进来…

一文读懂:大模型RAG(检索增强生成)

RAG
检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。
理解不难,就是通过自有…

一文搞懂大模型RAG应用(附实践案例)

写在前面

大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型就会面临专业知识…

创业:大模型RAG系统三个月的开发心得和思考

软件工程、Java、Javascript,公众号:八一菜刀
1. 前言

自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,…

干货 | 深度多元时序模型在携程关键指标预测场景下的探索应用

作者简介
doublering,携程高级算法工程师,关注自然语言处理、LLMs、时序预测等领域。
一、背景
互联网行业中,有许多关键指标直接影响公司未来的规划与…

基于短期替代变量的因果效应估计

本篇文章分为:
1. 前言
2. 模型方案
2.1 替代指数背景
2.2 替代指数的基本设定
2.3 模型结构
3.评估
4.总结与展望
1. 前言
在网约车双…

初识滴滴交易策略之三:供需调节

本篇文章分为:
1.什么是交易市场中的供需?

供需的动态性
供需的相互作用

2.滴滴业务场景涉及的供需调节技术

供需感知和供需预测

时序预测

供…

美团外卖智能陪伴型导购的探索与实践

相比于其他电商场景,外卖场景对于实时发现和反馈用户兴趣的能力有着更高的要求。近年来,美团外卖算法团队摸索出了一套适用于外卖场景的智能陪伴型导购架构和策略。这一举…

干货 | 贝叶斯结构模型在全量营销效果评估的应用

作者简介
Yiwen,携程数据分析师,专注用户增长、因果推断、数据科学等领域。
一、背景
如何科学地推断某个产品策略对观测指标产生的效应非常重要,这能够帮助产品…

斩获CVPR 2023竞赛2项冠军|美团街景理解中视觉分割技术的探索与应用

视觉分割技术在街景理解中具有重要地位,同时也面临诸多挑战。美团街景理解团队经过长期探索,构建了一套兼顾精度与效率的分割技术体系,在应用中取得了显著效果。同时,相…

大模型推理优化实践:KV cache复用与投机采样

阿里妹导读
在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架…

从零构建现代深度学习框架(TinyDL-0.01)

阿里妹导读
本文主要以一个Java工程师视角,阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架(类比AI的操作系统)。
本文主…

算法工程师如何拿结果:走过低谷,先立信念

阿里妹导读
作者结合自己在推荐算法领域的工作经验讨论“如何拿结果”这个问题。
引言
到了绩效季前整理收益和工作的时候,有时候会遇到明明好像干了很多事情,但是收…

线程操纵术之更优雅的并行策略

阿里妹导读
本文详细介绍了并行编程以及一些并行问题案例中的真实业务场景。如何写出更优雅的并行程序?有哪些风险和注意事项?本文来为你解答。

Photo by …

什么是优化技术?给算法小白同学的快速讲解和上手文

阿里妹导读
本文作者用一个曾经小白学习的视角,来讲解什么是优化问题,以及要如何用这个优化技术。背景
作为阿里达摩院MindOpt的产品经理,经常被尊贵的客户问…

多模态技术在淘宝主搜召回场景的探索

导语:**搜索召回作为搜索系统的基础,决定了效果提升的上限。如何在现有的海量召回结果中,继续带来有差异化的增量价值,是我们面临的主要挑战。而多模态预训练与召回的…

多场景多任务学习在美团到店餐饮推荐的实践

美团到店餐饮算法团队在跨域迁移学习的长期实践中,基于多场景的业务背景,提出了分层信息抽取网络,提升了多场景多任务的建模效果。相关技术方案形成的学术论文已经被国际…

MRCP在美团语音交互中的实践和应用

当你和智能语音机器人对话交互时,你是否好奇电话背后的机器人如何“听懂”你的意思,又如何像人一样“回答”你的问题?其中比较重要的技术就是 MRCP。本文主要介绍了…