使用Ollama和Go基于文本嵌入模型实现文本向量化
基于RAG+大模型的应用已经成为当前AI应用领域的一个热门方向。RAG(Retrieval-Augmented Generation)将检索和生成两个步骤相结合…
Slf4j MDC使用与实现
前言
如今,在 Java 开发中,日志的打印输出是必不可少的,Slf4j + LogBack 的组合是最通用的方式。
有了日志之后,我们就可以追踪各种线上问题。…
Java对象头压缩—- 永久为Java应用“降本增效”
阿里妹导读
本文介绍了一下OpenJDK的最新技术,对象头压缩,来大幅优化Java对象的内存占用。
前言
Java丰富的生态和语言强大的内存管理技术(GC),…
大模型推理优化实践:KV cache复用与投机采样
阿里妹导读
在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架…
代码整洁之道–告别码农,做一个有思想的程序员
阿里妹导读
代码整洁是软件长期稳定和可扩展的基础,本文作者从现实中的代码、重构、设计模式谈论代码整洁之道,总结出如何做一个有思想的程序员。
我心中理想的代码
…
Transformer 一起动手编码学原理
学习Transformer,快来跟着作者动手写一个。
作为工程同学,学习Transformer中,不动手写一个,总感觉理解不扎实。纸上得来终觉浅,绝知此事要…
超大规模数据库集群保稳系列之二:数据库攻防演练建设实践
本文整理自美团技术沙龙第75期的主题分享《美团数据库攻防演练建设实践》,系超大规模数据库集群保稳系列(内含4个议题的PPT及视频)的第2篇文章。
本文首先介绍了…
迈向端云一体 MNN2.0轻量级通用深度学习引擎详解
( 本文阅读时间:20分钟 )
MNN是一个轻量级的深度学习引擎,它通过独特的架构设计,结合各类性能优化的工作,解决了业务场景下深度学习部署的问题。近期MNN…
6年技术迭代,阿里全球化出海&合规的挑战和探索
( 本文阅读时间:20分钟 )
全球化技术根植于全球化业务,经过五个阶段的演进,逐渐发展成为阿里巴巴集团内相对独立的技术体系。本文会首先重点讲解全球化基础设施…
干货 | Node.js在携程的落地和最佳实践
作者简介
潘斐斐,Trip.com高级研发经理。2008年加入携程,目前工作内容为Node.js框架平台整体构建、产品性能优化和创新型项目研发。本文来自在201…
干货 | 微信小程序一键转百度小程序,携程火车票团队是这样做的
作者简介
张海明,携程火车票研发部开发经理。2015年加入携程,从事火车票Android、ReactNative和小程序相关研发工作。
一、前言
随着微信小程序…
如何在Go语言中使用Websockets:最佳工具与行动指南
以下文章来源于TonyBai ,作者白明的赞赏账户
如今,在不刷新页面的情况下发送消息并获得即时响应在我们看来是理所当然的事情。但是曾几何时,启用实时功能对开发…