我将为你详细分解实现一个基础版读写分离代理的步骤、核心概念,并提供一个简化的代码示例。
1. 核心设计思想
一个读写分离代理,本质上是一个位于应用程序和 MySQL 集群之间的中间件。它的工作流程如下:
监听端口:代理服务器监听一个端口(例如 3307),等待应用程序像连接普通 MySQL 一样连接它。
接收请求:接收来自客户端的 MySQL 协议数据包。
解析 SQL:这是最核心的一步。代理需要解析出客户端发送的 SQL 语句。
路由决策:
如果 SQL 是 SELECT 查询,并且当前连接不在一个事务中,就将这个查询转发给一个从库(Read Replica)。
如果 SQL 是 INSERT, UPDATE, DELETE 等写入操作,或者当前连接处于一个事务中(以 BEGIN 或 START TRANSACTION 开始),就必须将查询转发给主库(Primary/Master)。
转发与响应:将查询转发到选定的数据库(主库或从库),然后将数据库的响应原封不动地返回给客户端。
连接管理:高效地管理与后端主库和从库的连接池,以及与客户端的连接。
2. 实现的关键步骤和技术点
第一步:项目设置与依赖你需要一个强大的 SQL 解析库。从头实现 SQL 解析器非常复杂。业界最常用、最强大的 Go SQL 解析库是 Vitess 项目中的 sqlparser。
# 初始化项目 go mod init mysql-proxy # 添加依赖 go get vitess.io/vitess/go/vt/sqlparser go get github.com/go-sql-driver/mysql
vitess.io/vitess/go/vt/sqlparser: 用于解析 SQL 语句。
github.com/go-sql-driver/mysql: 用于代理连接到后端的真实 MySQL 数据库。
第二步:配置管理代理需要知道主库和从库的地址。一个简单的配置文件(如 config.yaml)是很好的选择。
# config.yaml master: "user:password@tcp(127.0.0.1:3306)/dbname" slaves: - "user:password@tcp(127.0.0.1:3308)/dbname" - "user:password@tcp(127.0.0.1:3309)/dbname" proxy_addr: "0.0.0.0:3307"第三步:后端连接池
为了提高性能,代理需要维护到主库和从库的连接池。Go 的 database/sql 包原生支持连接池,非常方便。
package main import ( "database/sql" _ "github.com/go-sql-driver/mysql" ) // DB Pools var ( masterDB *sql.DB slaveDBs []*sql.DB // 多个从库 ) func initDB(masterDSN string, slaveDSNs []string) error { var err error masterDB, err = sql.Open("mysql", masterDSN) if err != nil { return err } masterDB.SetMaxOpenConns(50) masterDB.SetMaxIdleConns(10) for _, dsn := range slaveDSNs { db, err := sql.Open("mysql", dsn) if err != nil { return err } db.SetMaxOpenConns(50) db.SetMaxIdleConns(10) slaveDBs = append(slaveDBs, db) } return nil }第四步:SQL 解析与路由逻辑
这是代理的核心。当收到一个 SQL 查询时,使用 sqlparser 来判断其类型。
package main import ( "fmt" "vitess.io/vitess/go/vt/sqlparser" ) // isReadonlyQuery 判断一个SQL语句是否是只读的 func isReadonlyQuery(query string) (bool, error) { stmt, err := sqlparser.Parse(query) if err != nil { return false, err } switch stmt.(type) { case *sqlparser.Select: // 检查是否是 SELECT ... FOR UPDATE // Vitess v15+ 的解析方式 sel, ok := stmt.(*sqlparser.Select) if ok && sel.Lock != "" { // "for update" or "lock in share mode" return false, nil } return true, nil case *sqlparser.Show, *sqlparser.Use, *sqlparser.Set: // SHOW, USE, SET 等命令通常可以发往从库 return true, nil default: // INSERT, UPDATE, DELETE, DDL, etc. return false, nil } } // isTransactionQuery 判断是否是事务控制语句 func isTransactionQuery(query string) (isBegin, isCommitOrRollback bool) { // 简化处理,实际场景更复杂 upperQuery := strings.ToUpper(strings.TrimSpace(query)) if upperQuery == "BEGIN" || upperQuery == "START TRANSACTION" { return true, false } if upperQuery == "COMMIT" || upperQuery == "ROLLBACK" { return false, true } return false, false }第五步:代理服务器主干 (简化的伪代码逻辑)
完整的代理需要实现 MySQL 的网络协议(Wire Protocol),这非常复杂。为了教学目的,我们先用一个简化的模型来展示核心的路由逻辑,而不是完整的协议实现。
下面的代码不是一个能直接运行的代理,因为它省略了复杂的 MySQL 协议握手、认证和数据包格式化部分。但它清晰地展示了如何组织路由逻辑。
package main import ( "database/sql" "fmt" "log" "math/rand" "net" "strings" "time" _ "github.com/go-sql-driver/mysql" "vitess.io/vitess/go/vt/sqlparser" ) // (此处省略 initDB, isReadonlyQuery, isTransactionQuery 函数的定义) var ( masterDB *sql.DB slaveDBs []*sql.DB ) // 这是一个“伪实现”,用于演示逻辑 // 真实代理需要处理MySQL的二进制协议 func handleConnection(conn net.Conn) { defer conn.Close() log.Printf("Client connected: %s", conn.RemoteAddr()) // 每个客户端连接维护自己的事务状态 inTransaction := false // 简单轮询策略选择从库 slavePicker := rand.New(rand.NewSource(time.Now().UnixNano())) // 循环读取客户端的 "查询" // 这是一个极度简化的模拟,真实情况是读取MySQL协议数据包 for { // 假设我们能从 conn 中神奇地读到SQL字符串 // 在真实世界中,你需要一个MySQL协议解析器 query, err := readQueryFromClient(conn) // readQueryFromClient 是一个伪函数 if err != nil { log.Printf("Failed to read from client: %v", err) return } var targetDB *sql.DB var targetRole string // 1. 事务状态判断 isBegin, isCommitOrRollback := isTransactionQuery(query) if inTransaction { if isCommitOrRollback { inTransaction = false } // 事务内的所有语句都发往主库 targetDB = masterDB targetRole = "MASTER (in transaction)" } else { if isBegin { inTransaction = true targetDB = masterDB targetRole = "MASTER (begin transaction)" } else { // 2. 读写判断 isRead, err := isReadonlyQuery(query) if err != nil { log.Printf("SQL parse error: %v", err) // 可以选择将解析失败的语句发往主库以求安全 targetDB = masterDB targetRole = "MASTER (parse failed)" } else { if isRead { // 发往从库(这里使用随机选择策略) targetDB = slaveDBs[slavePicker.Intn(len(slaveDBs))] targetRole = "SLAVE" } else { // 发往主库 targetDB = masterDB targetRole = "MASTER (write op)" } } } } log.Printf("Routing query to %s: %s", targetRole, query) // 3. 执行查询并将结果返回给客户端 // 这也是一个伪实现,真实情况需要将sql.Rows的结果集 // 格式化为MySQL协议的数据包再发回给客户端。 err = executeAndProxyResult(targetDB, query, conn) // executeAndProxyResult 是一个伪函数 if err != nil { log.Printf("Failed to execute query: %v", err) // 需要将错误信息也按协议格式返回 } } } // 伪函数,仅用于演示 func readQueryFromClient(conn net.Conn) (string, error) { // 真实实现:解析MySQL COM_QUERY包 // 这里我们用一个bufio.Reader简单模拟 // return bufio.NewReader(conn).ReadString('\n') return "", fmt.Errorf("this is a placeholder function") } // 伪函数,仅用于演示 func executeAndProxyResult(db *sql.DB, query string, conn net.Conn) error { // 真实实现:执行查询,然后将结果集(列信息、行数据、EOF包等) // 按照MySQL协议格式编码并写入conn // _, err := db.Exec(query) // ... return fmt.Errorf("this is a placeholder function") } func main() { // 1. 加载配置 (此处硬编码代替) masterDSN := "root:123456@tcp(127.0.0.1:3306)/test" slaveDSNs := []string{"root:123456@tcp(127.0.0.1:3308)/test"} proxyAddr := "127.0.0.1:3307" // 2. 初始化数据库连接池 if err := initDB(masterDSN, slaveDSNs); err != nil { log.Fatalf("Failed to init DB pools: %v", err) } log.Println("Database pools initialized.") // 3. 启动TCP监听 listener, err := net.Listen("tcp", proxyAddr) if err != nil { log.Fatalf("Failed to listen on %s: %v", proxyAddr, err) } defer listener.Close() log.Printf("MySQL proxy listening on %s", proxyAddr) // 4. 循环接受客户端连接 for { conn, err := listener.Accept() if err != nil { log.Printf("Failed to accept connection: %v", err) continue } go handleConnection(conn) } } // (此处省略 isReadonlyQuery 和 isTransactionQuery 的完整代码) // ...
6. 挑战与进阶
从上面的简化示例到生产级的代理,还有很多工作要做:
实现完整的 MySQL 协议:这是最大的挑战。你需要处理客户端和服务端的握手、认证、命令解析(COM_QUERY, COM_STMT_PREPARE等)、结果集编码(列定义、行数据、EOF、OK、ERR包)。从零开始非常困难,通常会使用现有的库或框架。
健康检查:代理需要定期检查后端数据库的健康状况。如果一个从库宕机或者复制延迟过高,应将其从可用列表中移除。
从库负载均衡:当有多个从库时,需要实现负载均衡策略,如轮询(Round-Robin)、随机(Random)、最少连接数等。
事务一致性:SELECT ... FOR UPDATE 这样的语句虽然是读操作,但会加锁,必须发往主库。sqlparser 可以帮助识别这种锁。
预编译(Prepared Statements):代理需要支持 PREPARE, EXECUTE, DEALLOCATE PREPARE,这会增加状态管理的复杂性。
优雅关闭(Graceful Shutdown):当代理需要关闭时,应等待现有连接处理完毕,而不是粗暴地切断。
配置热加载:能够在不重启代理的情况下,动态添加或移除后端数据库。
7. 现有开源方案
在生产环境中,从零构建代理的成本很高。强烈建议研究或直接使用成熟的开源方案:
Vitess: Google 开源的数据库集群解决方案,功能极其强大,包含了水平分片、读写分离、连接池等,是云原生数据库的事实标准之一。
ProxySQL: 一个高性能、高可用的 MySQL 代理,用 C++ 编写,功能非常丰富,配置驱动。
Kingshard: 一个由 Go 语言编写的高性能 MySQL 代理,支持读写分离、分库分表等。
网友回复