让天下没有难Tuning的大模型-PEFT技术简介
最近,深度学习的研究中出现了许多大型预训练模型,例如GPT-3、BERT等,这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中,ChatGPT模型因…
程序员系统入门大模型的路径和资源,看这篇就够了
本篇文章面向对大模型领域感兴趣,又不知如何下嘴的程序员。
看一下围绕大模型的应用场景和人才需求:
Prompt工程:
基于提示词对大模型的使用,会问问题就行。…
关于垂类场景下RAG 的思考
写在前面
今天这篇文章不是分享某个技术点也不是分享论文,而是笔者抛砖引玉的提出一些垂类下关于RAG 的瓶颈和一些思考,然后广发英雄帖,感兴趣的读者都可以加入进来…
一文读懂:大模型RAG(检索增强生成)
RAG
检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。
理解不难,就是通过自有…
一文搞懂大模型RAG应用(附实践案例)
写在前面
大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型就会面临专业知识…
创业:大模型RAG系统三个月的开发心得和思考
软件工程、Java、Javascript,公众号:八一菜刀
1. 前言
自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,…
干货 | 深度多元时序模型在携程关键指标预测场景下的探索应用
作者简介
doublering,携程高级算法工程师,关注自然语言处理、LLMs、时序预测等领域。
一、背景
互联网行业中,有许多关键指标直接影响公司未来的规划与…
干货 | 贝叶斯结构模型在全量营销效果评估的应用
作者简介
Yiwen,携程数据分析师,专注用户增长、因果推断、数据科学等领域。
一、背景
如何科学地推断某个产品策略对观测指标产生的效应非常重要,这能够帮助产品…
斩获CVPR 2023竞赛2项冠军|美团街景理解中视觉分割技术的探索与应用
视觉分割技术在街景理解中具有重要地位,同时也面临诸多挑战。美团街景理解团队经过长期探索,构建了一套兼顾精度与效率的分割技术体系,在应用中取得了显著效果。同时,相…
大模型推理优化实践:KV cache复用与投机采样
阿里妹导读
在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架…
从零构建现代深度学习框架(TinyDL-0.01)
阿里妹导读
本文主要以一个Java工程师视角,阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架(类比AI的操作系统)。
本文主…
算法工程师如何拿结果:走过低谷,先立信念
阿里妹导读
作者结合自己在推荐算法领域的工作经验讨论“如何拿结果”这个问题。
引言
到了绩效季前整理收益和工作的时候,有时候会遇到明明好像干了很多事情,但是收…
什么是优化技术?给算法小白同学的快速讲解和上手文
阿里妹导读
本文作者用一个曾经小白学习的视角,来讲解什么是优化问题,以及要如何用这个优化技术。背景
作为阿里达摩院MindOpt的产品经理,经常被尊贵的客户问…
多场景多任务学习在美团到店餐饮推荐的实践
美团到店餐饮算法团队在跨域迁移学习的长期实践中,基于多场景的业务背景,提出了分层信息抽取网络,提升了多场景多任务的建模效果。相关技术方案形成的学术论文已经被国际…
MRCP在美团语音交互中的实践和应用
当你和智能语音机器人对话交互时,你是否好奇电话背后的机器人如何“听懂”你的意思,又如何像人一样“回答”你的问题?其中比较重要的技术就是 MRCP。本文主要介绍了…