使用Ollama和Go基于文本嵌入模型实现文本向量化

基于RAG+大模型的应用已经成为当前AI应用领域的一个热门方向。RAG(Retrieval-Augmented Generation)将检索和生成两个步骤相结合…

解读Llama3

今天的大消息莫过于meta发布llama3[1]了,作为一个AI软件系统从业人员,趁热解读一下,总结版本如下:

llama3的发布,更强调了数据工程的重要:…

Slf4j MDC使用与实现

前言
如今,在 Java 开发中,日志的打印输出是必不可少的,Slf4j + LogBack 的组合是最通用的方式。
有了日志之后,我们就可以追踪各种线上问题。…

Java对象头压缩—- 永久为Java应用“降本增效”

阿里妹导读
本文介绍了一下OpenJDK的最新技术,对象头压缩,来大幅优化Java对象的内存占用。
前言
Java丰富的生态和语言强大的内存管理技术(GC),…

跟着iLogtail学习无锁化编程

阿里妹导读
锁是解决这些问题的传统方法,而无锁化编程是一种更高级但复杂的技术,它能够在某些情况下提供更优的性能和可扩展性。正确选择和实现适合应用场景的并发策略…

大模型推理优化实践:KV cache复用与投机采样

阿里妹导读
在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架…

浅谈C++20 协程那点事儿

阿里妹导读
本文是 C++20 的协程入门文章,作者围绕协程的概念到协程的实现思路全方位进行讲解,努力让本文成为全网最好理解的「C++20 协程」原理解析文章…

一文讲透阿里商旅账单系统架构设计实践

阿里妹导读
阿里商旅作为飞猪旅行旗下面向企业客户的数字化差旅解决方案产品,依托飞猪旅行机票、酒店供应链为企业客户提供一站式的机票、酒店、火车票、用车等预订管控…

一文聊聊代码的可读性

阿里妹导读
作者通过本文聊聊自己写代码的要求及代码的可读性。
观点表达

上图代码中,你觉得左边实现更好,还是右边的实现更好 ?你的代码是更像左边还是更…

代码整洁之道–告别码农,做一个有思想的程序员

阿里妹导读
代码整洁是软件长期稳定和可扩展的基础,本文作者从现实中的代码、重构、设计模式谈论代码整洁之道,总结出如何做一个有思想的程序员。
我心中理想的代码

Transformer 一起动手编码学原理


学习Transformer,快来跟着作者动手写一个。
作为工程同学,学习Transformer中,不动手写一个,总感觉理解不扎实。纸上得来终觉浅,绝知此事要…

跟着iLogtail学习设计模式

本文将结合 iLogtail 项目,从实践角度探讨一些常见设计模式的技术原理。
设计模式是软件开发中的重要经验总结,Gang of Four (GoF) 提出…

超大规模数据库集群保稳系列之二:数据库攻防演练建设实践

本文整理自美团技术沙龙第75期的主题分享《美团数据库攻防演练建设实践》,系超大规模数据库集群保稳系列(内含4个议题的PPT及视频)的第2篇文章。
本文首先介绍了…

迈向端云一体 MNN2.0轻量级通用深度学习引擎详解

( 本文阅读时间:20分钟 )
MNN是一个轻量级的深度学习引擎,它通过独特的架构设计,结合各类性能优化的工作,解决了业务场景下深度学习部署的问题。近期MNN…

阿里前端智能化技术探索和未来思考

所以我们2021年选定了两个方向来优化我们的端上引擎:WASM+Rust+SIMD和WebGPU。TensorFlow.js虽然没有使用Rust,但是也在使用W…

6年技术迭代,阿里全球化出海&合规的挑战和探索

( 本文阅读时间:20分钟 )
全球化技术根植于全球化业务,经过五个阶段的演进,逐渐发展成为阿里巴巴集团内相对独立的技术体系。本文会首先重点讲解全球化基础设施…

达摩院语音AI技术创新全景

作者:陈谦、邓憧、付强、高志付、胡凯、罗浩能、纳跃跃、田彪、王雯、鄢志杰、张仕良、张庆林、郑斯奇(以姓氏首字母排序)
戳这里查看更多AI技术干货👇

( 本文阅…

干货 | Node.js在携程的落地和最佳实践

作者简介
潘斐斐,Trip.com高级研发经理。2008年加入携程,目前工作内容为Node.js框架平台整体构建、产品性能优化和创新型项目研发。本文来自在201…

干货 | 微信小程序一键转百度小程序,携程火车票团队是这样做的

作者简介
张海明,携程火车票研发部开发经理。2015年加入携程,从事火车票Android、ReactNative和小程序相关研发工作。
一、前言
随着微信小程序…

如何在Go语言中使用Websockets:最佳工具与行动指南

以下文章来源于TonyBai ,作者白明的赞赏账户
如今,在不刷新页面的情况下发送消息并获得即时响应在我们看来是理所当然的事情。但是曾几何时,启用实时功能对开发…