搜索

回答

要使用 OpenCV 和 MediaPipe 识别摄像头中人物的手指数量，可以结合 MediaPipe 的手部关键点检测模型和 OpenCV 的图像处理能力。

MediaPipe 提供了高效的手部关键点检测算法，能定位 21 个手部关键点（包括手指关节和手掌位置），通过分析这些关键点的位置关系即可判断手指是否伸直。以下是具体实现步骤和代码示例：

1. 核心原理

MediaPipe 手部关键点检测：

MediaPipe 的 hands 模块可以实时检测手部的 21 个关键点（如下图），包括手指关节和手掌位置。通过关键点的坐标关系，可以判断每个手指是否伸直。 800_auto

手指伸直判断逻辑：

对于每个手指（如食指、中指等），检查其指尖点（如第 8、12、16、20 号关键点）是否高于其他关节点的位置。例如：如果食指的指尖（第 8 号点）的 y 坐标小于中关节（第 6 号点）的 y 坐标，则认为食指是伸直的。

2. 实现步骤(1) 安装依赖库

pip install opencv-python mediapipe

(2) 完整代码

import cv2
import mediapipe as mp

# 初始化 MediaPipe 手部模型
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(
    static_image_mode=False,       # 视频流模式（非静态图像）
    max_num_hands=2,              # 最多检测 2 只手
    min_detection_confidence=0.5, # 检测置信度阈值
    min_tracking_confidence=0.5   # 跟踪置信度阈值
)
mp_draw = mp.solutions.drawing_utils  # 绘制关键点的工具

# 打开摄像头
cap = cv2.VideoCapture(0)

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # 将图像转换为 RGB 格式（MediaPipe 要求）
    rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    results = hands.process(rgb_frame)

    if results.multi_hand_landmarks:
        for hand_landmarks in results.multi_hand_landmarks:
            # 绘制手部关键点和连线
            mp_draw.draw_landmarks(
                frame, hand_landmarks, mp_hands.HAND_CONNECTIONS)

            # 提取关键点坐标
            landmarks = hand_landmarks.landmark
            height, width, _ = frame.shape

            # 定义手指关键点索引（MediaPipe 的 21 个关键点）
            finger_tips = [4, 8, 12, 16, 20]  # 指尖：大拇指、食指、中指、无名指、小指
            finger_bases = [2, 6, 10, 14, 18]  # 对应的基关节

            count = 0  # 记录伸直的手指数量

            # 遍历每个手指（大拇指单独处理）
            for i in range(1, 5):  # 只处理食指、中指、无名指、小指
                tip_y = landmarks[finger_tips[i]].y * height
                base_y = landmarks[finger_bases[i]].y * height
                # 如果指尖的 y 坐标小于基关节的 y 坐标，则认为手指伸直
                if tip_y < base_y:
                    count += 1

            # 处理大拇指（判断横向位置）
            thumb_tip_x = landmarks[finger_tips[0]].x * width
            thumb_base_x = landmarks[finger_bases[0]].x * width
            # 根据左右手调整判断逻辑（假设检测到的是右手）
            if thumb_tip_x < thumb_base_x:
                count += 1

            # 在画面中显示手指数量
            cv2.putText(frame, f"Fingers: {count}", (10, 50),
                        cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

    # 显示画面
    cv2.imshow('Finger Count', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

3. 代码解释

初始化 MediaPipe 手部模型：

static_image_mode=False 表示处理视频流。max_num_hands=2 允许同时检测两只手。

关键点检测与绘制：

hands.process() 返回检测到的手部关键点坐标。mp_draw.draw_landmarks() 绘制关键点和手部连线。

判断手指伸直的逻辑：

对于食指、中指、无名指、小指：通过比较指尖（如第 8 号点）与基关节（如第 6 号点）的 y 坐标。对于大拇指：通过比较指尖（第 4 号点）与基关节（第 2 号点）的 x 坐标（需根据左右手调整方向）。

显示结果：

在画面左上角实时显示伸直的手指数量。

4. 优化方向左右手区分：通过 results.multi_handedness 判断检测到的是左手还是右手，调整大拇指的判断逻辑。

动态阈值调整：根据手部距离摄像头的远近动态调整判断阈值。抗抖动：通过历史帧平滑手指数量结果，避免快速变化。

3D 空间判断：利用 MediaPipe 的 3D 坐标信息（landmark.z）更精确判断手指状态。

5. 效果示例

运行代码后，摄像头画面会实时显示手部关键点和伸直的手指数量：

通过这种方法，可以快速实现基于手势的交互功能（如手势控制、游戏操作等）。

网友回复

我知道答案，我要回答

我有问题

私活外包

回答

开发了一个网站ai聊天助手

一个月开发一套类似coze的智能体平台

部署一套内网离线ai助理

私有ai助理开发

类似如家的租房app开发

h5手机端考试网站开发

开发一个短剧解锁剧集的小程序

我要开发一个酒类拍卖交易平台

开发艺术品拍卖收藏买画卖画h5网站

帮我做个数字货币交易所网站

技术上如何解决被曝光的ai投毒geo行为？

有没有哪个大模型可以根据声音和文字描述生成带声音的视频？

如何实现华为手机终端设备之间隔空握拳抓取传送信息？

WinUI3和Electron有啥不同？

有哪些版权中心可以合作发布短剧漫剧进行赚钱？

ai装修解压视频提示词如何写？

有哪些视频钩子可以解决5s完播低问题？

seedance2如何根据一张九宫格分镜头图片生成ai视频短剧？

www.gstatic.com打开报错net::ERR_TUNNEL_CONNECTION_FAILED

果蝇大脑神经在计算机中复原意味人脑神经和意识也可在计算机中复原？