我将为你详细分解实现一个基础版读写分离代理的步骤、核心概念,并提供一个简化的代码示例。
1. 核心设计思想
一个读写分离代理,本质上是一个位于应用程序和 MySQL 集群之间的中间件。它的工作流程如下:
监听端口:代理服务器监听一个端口(例如 3307),等待应用程序像连接普通 MySQL 一样连接它。
接收请求:接收来自客户端的 MySQL 协议数据包。
解析 SQL:这是最核心的一步。代理需要解析出客户端发送的 SQL 语句。
路由决策:
如果 SQL 是 SELECT 查询,并且当前连接不在一个事务中,就将这个查询转发给一个从库(Read Replica)。
如果 SQL 是 INSERT, UPDATE, DELETE 等写入操作,或者当前连接处于一个事务中(以 BEGIN 或 START TRANSACTION 开始),就必须将查询转发给主库(Primary/Master)。
转发与响应:将查询转发到选定的数据库(主库或从库),然后将数据库的响应原封不动地返回给客户端。
连接管理:高效地管理与后端主库和从库的连接池,以及与客户端的连接。
2. 实现的关键步骤和技术点
第一步:项目设置与依赖你需要一个强大的 SQL 解析库。从头实现 SQL 解析器非常复杂。业界最常用、最强大的 Go SQL 解析库是 Vitess 项目中的 sqlparser。
# 初始化项目 go mod init mysql-proxy # 添加依赖 go get vitess.io/vitess/go/vt/sqlparser go get github.com/go-sql-driver/mysql
vitess.io/vitess/go/vt/sqlparser: 用于解析 SQL 语句。
github.com/go-sql-driver/mysql: 用于代理连接到后端的真实 MySQL 数据库。
第二步:配置管理代理需要知道主库和从库的地址。一个简单的配置文件(如 config.yaml)是很好的选择。
# config.yaml master: "user:password@tcp(127.0.0.1:3306)/dbname" slaves: - "user:password@tcp(127.0.0.1:3308)/dbname" - "user:password@tcp(127.0.0.1:3309)/dbname" proxy_addr: "0.0.0.0:3307"第三步:后端连接池
为了提高性能,代理需要维护到主库和从库的连接池。Go 的 database/sql 包原生支持连接池,非常方便。
package main
import (
"database/sql"
_ "github.com/go-sql-driver/mysql"
)
// DB Pools
var (
masterDB *sql.DB
slaveDBs []*sql.DB // 多个从库
)
func initDB(masterDSN string, slaveDSNs []string) error {
var err error
masterDB, err = sql.Open("mysql", masterDSN)
if err != nil {
return err
}
masterDB.SetMaxOpenConns(50)
masterDB.SetMaxIdleConns(10)
for _, dsn := range slaveDSNs {
db, err := sql.Open("mysql", dsn)
if err != nil {
return err
}
db.SetMaxOpenConns(50)
db.SetMaxIdleConns(10)
slaveDBs = append(slaveDBs, db)
}
return nil
} 第四步:SQL 解析与路由逻辑这是代理的核心。当收到一个 SQL 查询时,使用 sqlparser 来判断其类型。
package main
import (
"fmt"
"vitess.io/vitess/go/vt/sqlparser"
)
// isReadonlyQuery 判断一个SQL语句是否是只读的
func isReadonlyQuery(query string) (bool, error) {
stmt, err := sqlparser.Parse(query)
if err != nil {
return false, err
}
switch stmt.(type) {
case *sqlparser.Select:
// 检查是否是 SELECT ... FOR UPDATE
// Vitess v15+ 的解析方式
sel, ok := stmt.(*sqlparser.Select)
if ok && sel.Lock != "" {
// "for update" or "lock in share mode"
return false, nil
}
return true, nil
case *sqlparser.Show, *sqlparser.Use, *sqlparser.Set:
// SHOW, USE, SET 等命令通常可以发往从库
return true, nil
default:
// INSERT, UPDATE, DELETE, DDL, etc.
return false, nil
}
}
// isTransactionQuery 判断是否是事务控制语句
func isTransactionQuery(query string) (isBegin, isCommitOrRollback bool) {
// 简化处理,实际场景更复杂
upperQuery := strings.ToUpper(strings.TrimSpace(query))
if upperQuery == "BEGIN" || upperQuery == "START TRANSACTION" {
return true, false
}
if upperQuery == "COMMIT" || upperQuery == "ROLLBACK" {
return false, true
}
return false, false
} 第五步:代理服务器主干 (简化的伪代码逻辑)完整的代理需要实现 MySQL 的网络协议(Wire Protocol),这非常复杂。为了教学目的,我们先用一个简化的模型来展示核心的路由逻辑,而不是完整的协议实现。
下面的代码不是一个能直接运行的代理,因为它省略了复杂的 MySQL 协议握手、认证和数据包格式化部分。但它清晰地展示了如何组织路由逻辑。
package main
import (
"database/sql"
"fmt"
"log"
"math/rand"
"net"
"strings"
"time"
_ "github.com/go-sql-driver/mysql"
"vitess.io/vitess/go/vt/sqlparser"
)
// (此处省略 initDB, isReadonlyQuery, isTransactionQuery 函数的定义)
var (
masterDB *sql.DB
slaveDBs []*sql.DB
)
// 这是一个“伪实现”,用于演示逻辑
// 真实代理需要处理MySQL的二进制协议
func handleConnection(conn net.Conn) {
defer conn.Close()
log.Printf("Client connected: %s", conn.RemoteAddr())
// 每个客户端连接维护自己的事务状态
inTransaction := false
// 简单轮询策略选择从库
slavePicker := rand.New(rand.NewSource(time.Now().UnixNano()))
// 循环读取客户端的 "查询"
// 这是一个极度简化的模拟,真实情况是读取MySQL协议数据包
for {
// 假设我们能从 conn 中神奇地读到SQL字符串
// 在真实世界中,你需要一个MySQL协议解析器
query, err := readQueryFromClient(conn) // readQueryFromClient 是一个伪函数
if err != nil {
log.Printf("Failed to read from client: %v", err)
return
}
var targetDB *sql.DB
var targetRole string
// 1. 事务状态判断
isBegin, isCommitOrRollback := isTransactionQuery(query)
if inTransaction {
if isCommitOrRollback {
inTransaction = false
}
// 事务内的所有语句都发往主库
targetDB = masterDB
targetRole = "MASTER (in transaction)"
} else {
if isBegin {
inTransaction = true
targetDB = masterDB
targetRole = "MASTER (begin transaction)"
} else {
// 2. 读写判断
isRead, err := isReadonlyQuery(query)
if err != nil {
log.Printf("SQL parse error: %v", err)
// 可以选择将解析失败的语句发往主库以求安全
targetDB = masterDB
targetRole = "MASTER (parse failed)"
} else {
if isRead {
// 发往从库(这里使用随机选择策略)
targetDB = slaveDBs[slavePicker.Intn(len(slaveDBs))]
targetRole = "SLAVE"
} else {
// 发往主库
targetDB = masterDB
targetRole = "MASTER (write op)"
}
}
}
}
log.Printf("Routing query to %s: %s", targetRole, query)
// 3. 执行查询并将结果返回给客户端
// 这也是一个伪实现,真实情况需要将sql.Rows的结果集
// 格式化为MySQL协议的数据包再发回给客户端。
err = executeAndProxyResult(targetDB, query, conn) // executeAndProxyResult 是一个伪函数
if err != nil {
log.Printf("Failed to execute query: %v", err)
// 需要将错误信息也按协议格式返回
}
}
}
// 伪函数,仅用于演示
func readQueryFromClient(conn net.Conn) (string, error) {
// 真实实现:解析MySQL COM_QUERY包
// 这里我们用一个bufio.Reader简单模拟
// return bufio.NewReader(conn).ReadString('\n')
return "", fmt.Errorf("this is a placeholder function")
}
// 伪函数,仅用于演示
func executeAndProxyResult(db *sql.DB, query string, conn net.Conn) error {
// 真实实现:执行查询,然后将结果集(列信息、行数据、EOF包等)
// 按照MySQL协议格式编码并写入conn
// _, err := db.Exec(query)
// ...
return fmt.Errorf("this is a placeholder function")
}
func main() {
// 1. 加载配置 (此处硬编码代替)
masterDSN := "root:123456@tcp(127.0.0.1:3306)/test"
slaveDSNs := []string{"root:123456@tcp(127.0.0.1:3308)/test"}
proxyAddr := "127.0.0.1:3307"
// 2. 初始化数据库连接池
if err := initDB(masterDSN, slaveDSNs); err != nil {
log.Fatalf("Failed to init DB pools: %v", err)
}
log.Println("Database pools initialized.")
// 3. 启动TCP监听
listener, err := net.Listen("tcp", proxyAddr)
if err != nil {
log.Fatalf("Failed to listen on %s: %v", proxyAddr, err)
}
defer listener.Close()
log.Printf("MySQL proxy listening on %s", proxyAddr)
// 4. 循环接受客户端连接
for {
conn, err := listener.Accept()
if err != nil {
log.Printf("Failed to accept connection: %v", err)
continue
}
go handleConnection(conn)
}
}
// (此处省略 isReadonlyQuery 和 isTransactionQuery 的完整代码)
// ... 6. 挑战与进阶
从上面的简化示例到生产级的代理,还有很多工作要做:
实现完整的 MySQL 协议:这是最大的挑战。你需要处理客户端和服务端的握手、认证、命令解析(COM_QUERY, COM_STMT_PREPARE等)、结果集编码(列定义、行数据、EOF、OK、ERR包)。从零开始非常困难,通常会使用现有的库或框架。
健康检查:代理需要定期检查后端数据库的健康状况。如果一个从库宕机或者复制延迟过高,应将其从可用列表中移除。
从库负载均衡:当有多个从库时,需要实现负载均衡策略,如轮询(Round-Robin)、随机(Random)、最少连接数等。
事务一致性:SELECT ... FOR UPDATE 这样的语句虽然是读操作,但会加锁,必须发往主库。sqlparser 可以帮助识别这种锁。
预编译(Prepared Statements):代理需要支持 PREPARE, EXECUTE, DEALLOCATE PREPARE,这会增加状态管理的复杂性。
优雅关闭(Graceful Shutdown):当代理需要关闭时,应等待现有连接处理完毕,而不是粗暴地切断。
配置热加载:能够在不重启代理的情况下,动态添加或移除后端数据库。
7. 现有开源方案
在生产环境中,从零构建代理的成本很高。强烈建议研究或直接使用成熟的开源方案:
Vitess: Google 开源的数据库集群解决方案,功能极其强大,包含了水平分片、读写分离、连接池等,是云原生数据库的事实标准之一。
ProxySQL: 一个高性能、高可用的 MySQL 代理,用 C++ 编写,功能非常丰富,配置驱动。
Kingshard: 一个由 Go 语言编写的高性能 MySQL 代理,支持读写分离、分库分表等。
网友回复


