Skip to content
/ StudyAI Public

In addition to the papers I published, you can also learn about the field of artificial intelligence in one minute every day. 除了我发布的论文外,在这里还可以每天一分钟,让你快速掌握人工智能领域

Notifications You must be signed in to change notification settings

AI-QKV/StudyAI

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

89 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

优化模型论文-----预印本

本论文于2025-4-29首发于Github,引用请署名,

中文版 《多模态大模型的高效优化框架:模块化累积效应与质变》

PNG版 How to Optimize Multimodal Large Language Models

本预印本论文于2025-5-6首发于Github,引用请署名

中文版 《双维度建模:量化端到端稳定率方法研究》

Dual_Dimensional A Method for Quantifying End-to-End Stability Rate


很多学者在初学大模型的时候,耗时耗力没有找到合适的入门资料,欢迎使用下面的教程

入门级教程————单词级别的模型训练

入门级教程————单词级别的LoRA微调


《多模态大模型的高效优化框架:模块化累积效应与质变》的实战之(业务层级)


一分钟让你学会AI

自己总结的,大白话学习AI

RAG 智能问答 智能检索 系统

一分钟明白整体架构,以下架构适用于大多数智能问答和RAG检索系统。如转载请注明出处,也是我坚持原创技术分享的动力!
============================整体架构====================================
业务层: 【智能问答】【RAG检索】【图片生成】【视频处理】【其他业务1 / 其他业务2 ...】
中间层: 【Langchain】【LangGraph】【LlamaIndex】【Agent】【Workflow】
核心层: 【Lora】【DPO】【向量数据库】【图数据库】【图片特征处理】【API管理】
模型层: 【Qwen / DeepSeek / MOE 】【DDPM】【DALL】
硬件层: 【4090 24G】【A100 80G】【H100 80G】【V100 48G】【L40 48G】
=======================================================================

大白话理解Transormer模型

大白话理解什么是DPO(人类偏好对齐)

大白话理解什么是LoRA(Low-Rank Adaptation)

大白话理解什么是RoPE(旋转位置编码)

大白话理解DDPM模型

大白话理解什么是FFN(前馈神经网络)

大白话理解什么是层归一化

大白话理解什么是Bias

大白话理解什么是MOE

大白话理解什么是RAG

大白话理解什么是MCP

大白话理解什么是RNN

大白话理解什么是LangChain

大白话理解什么是QKV

大白话理解什么是Token

About

In addition to the papers I published, you can also learn about the field of artificial intelligence in one minute every day. 除了我发布的论文外,在这里还可以每天一分钟,让你快速掌握人工智能领域

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages