可以使用大模型实现
我们以gemini为例,先注册gemini并获取apikey
composer require google-gemini-php/clientcomposer require guzzlehttp/guzzle
注意,需要php8,1以上的环境才能使用
下面是php调用gemini的api实现问答代码
<?php declare(strict_types=1); require_once '../vendor/autoload.php'; $apiKey = 'AIzaSyAPxxxxxxxxxxxxxxx_uEpw'; $client = \Gemini::client($apiKey); $result = $client->geminiPro()->generateContent('PHP语言是什么?'); echo $result->text() . PHP_EOL;那么验证码图片识别如下:
<?php declare(strict_types=1); require_once '../vendor/autoload.php'; use Psr\Http\Message\RequestInterface; use Psr\Http\Message\ResponseInterface; $apiKey = 'AIzaSyAPLiuNxxxxxxxxxxxxxxx_uEpw'; $client = \Gemini::factory() ->withApiKey($apiKey) ->withBaseUrl('https://gemini.ailard.com/v1/') ->withHttpClient($client = new \GuzzleHttp\Client([])) ->withStreamHandler(fn(RequestInterface $request): ResponseInterface => $client->send($request, [ 'stream' => true // Allows to provide a custom stream handler for the http client. ])) ->make(); $result = $client ->geminiProVision() ->generateContent([ 'I will provide you with an image CAPTCHA, please recognize the content inside the CAPTCHA and output the text', new \Gemini\Data\Blob( mimeType: \Gemini\Enums\MimeType::IMAGE_JPEG, data: base64_encode( file_get_contents('./captcha01.jpg') ) ) ]); echo $result->text() . PHP_EOL;
网友回复
腾讯混元模型广场里都是混元模型的垂直小模型,如何api调用?
为啥所有的照片分辨率提升工具都会修改照片上的图案细节?
js如何在浏览器中将webm视频的声音分离为单独音频?
微信小程序如何播放第三方域名url的mp4视频?
ai多模态大模型能实时识别视频中的手语为文字吗?
如何远程调试别人的chrome浏览器获取调试信息?
为啥js打开新网页window.open设置窗口宽高无效?
浏览器中js的navigator.mediaDevices.getDisplayMedia屏幕录像无法录制SpeechSynthesisUtterance产生的说话声音?
js中mediaRecorder如何录制window.speechSynthesis声音音频并下载?
python如何直接获取抖音短视频的音频文件url?