2026-07-09

AGENTS.md 全局核心规则模板

全局通用的 AGENTS.md(编码通用) 全局的规则一般放在全局配置文件中, 在所有项目中都生效, 一般写一些通用规则 ## 身份定位你是**资深架构师 + 全栈专业编码助手**，具备完整的工程化思维、架构设计能力、问题排查能力、代码落地能力。所有输出以**工程规范、项目现状、可落地、可维护**为第一准则，专注高效、高质量完成开发任务，无无效闲聊、无冗余输出。 ## 全局基础强制规则...

继续阅读 »

2026-06-20

vLLM 0.19.0 完整启动参数中文手册

vLLM 0.19.0+6bc3197f 启动参数完整中文手册容器基础信息项内容 NVIDIA Release 26.04 (build 299333414) vLLM 版本 0.19.0+6bc3197f 版权 2026 NVIDIA CORPORATION & AFFILIATES 许可协议 NVIDIA 企业软件许可协议 + AI 产品专项条款 ...

继续阅读 »

2026-06-16

Nginx代理大模型LLM项目(SSE流式输出)

‌proxy_buffering 是 Nginx 反向代理中控制是否缓冲后端响应的开关‌，默认开启，开启时先攒够数据再发给客户端，关闭时边收边转适合流式场景。保持开启（proxy_buffering on）的场景‌：普通 REST API 接口（返回 JSON/XML 数据）。静态资源服务（HTML/CSS/JS 文件）。需要在网关层统一添加或修改响应头的情况。配合 proxy_...

继续阅读 »

2026-06-10

Qwen3-Embedding与Qwen3-Reranker模型教程

扩展阅读零基础入门文本嵌入：Qwen3-Embedding-0.6B保姆级教程从0开始学文本嵌入：Qwen3-Embedding-4B+SGlang新手入门 Qwen3 Embedding 详解：大模型时代的文本向量与重排新基准零基础入门：手把手教你使用Qwen3-Reranker进行文本排序

继续阅读 »

2026-06-07

NVIDIA DGX Spark 的基本使用

简介 NVIDIA DGX Spark 是英伟达推出的‌桌面级 AI 超级计算机‌，主打‌128GB 统一内存‌和‌1 PFLOP 算力‌，起售价‌3999 美元‌，专为开发者在本地运行大模型设计。‌‌ 开机设置注意: DGX Spark 设备在通电时会立即启动。请在通电前链接好设备。开机有两种连接方式: 带显示器的连接(显示器/键盘/鼠标), 见扩展阅读使用机器自带的热点连接, 系...

继续阅读 »

2026-06-05

目前搭建大模型的工具有哪些(2026)

以下是整合后的全栈工具图谱，按环节分类并附市场占有率排行，最后给出经过验证的主流组合方案。数据综合自 GitHub 星数、学术论文引用、云服务商支持度及社区调研（2024–2025）。一、底层训练框架与分布式库排名工具市占率/影响力说明 🥇 PyTorch 框架层 80%+ 大模型研究的绝对基石，LLaMA、Mistral、Qwen 等均基于 PyTorch 生态 ...

继续阅读 »

2026-05-23

阿里云应用迁移步骤

数据和应用从原始服务器迁移到云端成型后的服务器架构大概如下: 负载均衡 - 服务器集群 - MySQL集群 - Redis集群其中服务器集群: 原始服务器(仅做异步任务, 日志收集等), 其他多台高配置服务器对外提供服务服务集群可一键添加新服务器(不停机) MySQL读写分离, 也可一键添加新服务器(不停机) Redis读写分离, 也可一键添加新的分片(不停机) 海外加速(负载均衡)...

继续阅读 »

2026-05-19

阿里云弹性伸缩配置遇到的一些问题

阿里云弹性伸缩弹性伸缩可在业务需求增长时自动增加ECS实例以保证计算能力，在业务需求下降时自动减少ECS实例以节约成本产品选购伸缩组名称: 写容易辨认的名称伸缩组类型: 这里选择ECS 组内实例配置信息来源: 启动模板选择启动模板: 如果没有需要创建一个启动模板, 启动模板很重要, 启动模板就和选服务器差不多, 注意vpc, 可用区等要和主服务器一致组内期望实例数: 0, 如果...

继续阅读 »

2026-05-19

阿里云ALB配置遇到的一些问题-负载均衡

阿里云alb(应用型负载均衡) 购买选型参考资料: ALB快速实现IPv4服务的负载均衡地域: 选择服务器所在地实例类型: 公网(我们是要对外提供服务的) VPC: 选择服务器使用的vpc 可用区域: 选择服务器所在可用区域协议版本: 选择IPv4 功能版本: 选择标准版本就可以了, 如果对安全要求高可以选择WAF增强版本其他默认即可 ALB配置 - 配置服务器组参考资料: ...

继续阅读 »

2026-03-15

提示词工程最佳实践：AI编程领域

针对AI编程中如何编写提示词，让AI准确按需求编程、避免“乱写”（即生成无关、错误或偏离需求的代码），以下是一套系统的方法论和实用模板，能显著提升代码生成的准确性和可控性。万能公式又称指令工程，其核心在于设计精准提示词以引导模型准确捕捉用户需求。一个优秀的提示词能最大程度的引导大语言模型一步步思考，要有效防止AI幻觉。注意不要让ai来猜你的需求。万能公式：身份/场景 + 任务(简述) ...

继续阅读 »

2026-03-10

OpenClaw 记忆系统优化+Skill组合应用+团队写作

本章主要内容完成基本配置文件的创建（SOUL.md / USER.md / IDENTITY.md）记忆系统的基本概念（MEMORY.md 和 memorySearch）熟悉 workspace 目录结构工作空间与相关配置文件 ~/.openclaw/ ├── openclaw.json # 核心配置文件 ☆☆☆☆☆ ├── openclaw.js...

继续阅读 »

2026-03-10

OpenClaw 混合部署终极详细教程（QQ Channel + 云端 Gateway + 本地多 Node）

OpenClaw 混合部署终极详细教程（云端 Gateway + 本地 Node）核心架构：云端服务器仅部署 Gateway（控制中枢，24 小时在线），本地电脑仅部署 Node（执行端，负责实际操作本地设备），两者通过加密连接通信，本地无需暴露任何公网端口，安全且稳定。适用场景：远程控制个人电脑、自动化本地操作（文件管理/浏览器控制/应用操作）、跨设备任务调度。一、部署前核心认知 ...

继续阅读 »

2026-01-03

C# 从事件驱动编程到实现协程版本Actor模型

概述本文主要理解从事件驱动编程到实现完整版本的Actor模型，再将Actor模型进化到最终的协程版 Actor 模型，最后实现一个高性能游戏服务器基本架构。事件驱动编程 or 轮询轮询是 CPU 主动查，事件驱动是「状态变化时，主动通知 CPU」，CPU 在没事件的时候，线程是挂起 / 休眠 / 空闲状态，此时该线程的 CPU 占用率≈0%，这是最关键的点。轮训: 轮询：CPU 主...

继续阅读 »

2025-12-23

Laravel 10 水平分表优化

Laravel10水平分表优化核心: 解耦、自动化、高性能、可监控封装 BaseShardingModel 基类，消除重复代码，统一分表逻辑，业务模型极简接入；实现通用定时任务 + 建表命令，自动化创建分表，避免手动操作失误；遵循分表查询原则，使用 unionAll 优化跨分表查询，批量操作提升写入效率；兼容 Laravel ORM 高级特性（软删除、查询作用域），不改变原有开发习...

继续阅读 »

2025-12-22

RustDesk服务端搭建与客户端修改

服务端部署项目地址 1、服务端下载地址：https://github.com/rustdesk/rustdesk-server 2、(可选)NSSM工具下载地址：https://nssm.cc/release/nssm-2.24.zip 使用CMD执行以下命令： CD "服务端所在目录" nssm install "RustDesk hbbs ser...

继续阅读 »

2025-11-12

阿里云-高并发易扩展的系统架构方案

业务场景公司有一些活动, 参加人数20万左右, 活动现场报名,门禁,签到等, 特别是活动当前排队入场人数几百米, 需要一个高性能的易扩展的服务器方案. 架构方案高并发架构图略服务器选型一周新服务器, 64核心64G主服务器, 用于现场报名, 负载均衡标准版 + WAF防御 + 弹性伸缩(24核24G) 阿里云MySQL服务器, 内网, 16核32G 阿里云Tair(Redi...

继续阅读 »

2025-10-24

阿里云MySQL集群配置遇到的一些问题

购买时选型说明计费方式:包年包月地域: 深圳引擎: MySQL5.7 产品系列: 基础系列(单台), 高可用系列(一主一备的高可用架构,备节点不可访问, 可或者读能力), 集群系列(一主多备的高可用架构，支持自动故障切换。备节点可访问，提升读能力). 集群系列产品类型: 标准版存储类型: 高性能云盘比 ESSD云盘更好 VPC: 选择与服务器同一个主可用区及网络: 选择与服...

继续阅读 »

2025-10-22

阿里云Redis集群配置遇到的一些问题

阿里云Redis(tair) Redis开源版: 兼容Redis的高性能内存数据库产品 Tair（企业版）: 相比redis有更强的性能, 更丰富的数据结构, 更智能的代理等阿里云Redis的计费模式: 分片: 一个分片就是一个完整的规格, 整体性能=分片数x规格性能规格: 每个分片的规格, 关联CPU和内存, CPU都是3核心, 规格大小关联内存大小与带宽节点: 每个分片下的节点数,...

继续阅读 »

2025-09-16

Laravel 数据库操作返回及其相关操作

laravel中数据库查询 laravel中数据库查询方式: 原生SQL查询: DB::select('select * from users where active = 1') 查询构建器: DB::tables('users')->where('xxx')->get() 使用 Illuminate\Database\Query\Builder Eloquent ORM ...

继续阅读 »

2025-07-31

Nginx 配置 location 规则优先级

详细分析：Nginx 的 location 匹配优先级 Nginx 处理请求时，会按特定优先级匹配location规则，优先级从高到低为： location = /index.html {} 精确匹配, 匹配成功不再匹配其他项 location ^~ /path/ {} 前缀匹配, 匹配成功不再匹配其他项 location ~ 正则(区分大小写) {} 或 location ~* 正则(不...

继续阅读 »