ESP_MASTER 语音/人脸9大功能

ESP_MASTER 语音/人脸9大功能

本项目是以ESP32为核心,打造一个多功能集合的综合性极强的小模块。
electronics esp32

项目是Kevincoooool参加某个大赛开源的项目,原理图和代码开源。希望大家遵守开源协议,勿做商用或者售卖。

功能介绍

本项目是以ESP32为核心,尽可能榨干其MCU的能力,打造一个多功能集合的综合性极强的小模块,功能包含:
  • 语音识别:将数字麦克风通过I2S连接到ESP32,经过esp-skainet离线语音识别,自定义语音命令词最大个数为 100
  • 物体识别、文字识别(车牌识别):基于百度智能云,将摄像头获取的RGB图像转为JPG,经过base64和urlcode编码上传到百度云后获取识别结果来显示。
  • 颜色识别:可由摄像头获取的图像将RGB转为HSL判断每一个像素点,进行颜色块的识别,获取颜色块坐标。
  • 家电控制:可由语音设置空调类型,也可以在设置界面设置空调种类,当前支持格力、美的、海尔空调,空调码库由IREXT提供,码库存放在flash的spiffs分区中。
  • LVGL:基于LVGL 7.6.0,10余个界面切换。
  • ADC按键:在ESP32引脚极其不够的情况下,使用一个IO口,经过电阻分压可读取三个按键的状态。
  • FFT频谱:将数字麦克风通过I2S连接到ESP32,经过软件fft获得频谱通过lvgl img显示。
  • 小游戏:移植2048和贪吃蛇游戏。
  • 每日鸡汤:进入每日鸡汤界面后,HTTP随机获取一句话显示。
9大功能,想怎么玩就怎么玩,真的是要榨干ESP32的资源了。
ESP_MASTER 语音/人脸9大功能

硬件组成

硬件原理图如下:
ESP_MASTER 语音/人脸9大功能
核心的是ESP32-WROVER模组,内置16Mb Flash +4Mb PSRAM;其他的外设资源有:
  • 两个3528红外管
  • 四个按键
  • 一个数字麦克风 MSM261S4030H0高灵敏度数字硅麦芯片
  • 一个显示屏 可用1.3寸ST7789 240*240或者1.54寸 ST7789 240*240
  • 24P FPC摄像头插座 可使用OV7725 OV2640 OV5640
  • 一个陀螺仪 MPU6050
板子上串口转TTL使用CP2104,电源采用AP3410 可提供1.2A电流。
1.3寸PCB
ESP_MASTER 语音/人脸9大功能

1.5寸PCB
ESP_MASTER 语音/人脸9大功能

软件代码

软件部分采用IDF 4.4开发,主界面显示时间、天气、温度、日期、太空人小动画、B站粉丝和wifi连接情况,长按中键进入菜单选择按钮,菜单分别是
ESP_MASTER 语音/人脸9大功能
软件框图如下:
ESP_MASTER 语音/人脸9大功能

软件部分代码可以至Kevincoooool的github仓获取:https://github.com/Kevincoooool/ESP_MASTER

语音识别和人脸识别采用乐鑫开源的库。ESP32如何显示LVGL的外部flash字体:生成字体文件,使用LvglFontTool 这个工具,生成类型勾选XBF字体,外部BIN文件,会生成两个文件,一个myFont.c 和一个bin文件。然后把bin文件放到spiffs分区 编译的时候会自动烧录到flash里面,改动myFont.c以获取bin文件数据 第一次进入的时候初始化外部字体 读取spiffs文件到内存里。
#include "lvgl.h"
#include "stdio.h"
#include
#include
#include "esp_system.h"
#include "esp_vfs.h"
#include "esp_spiffs.h"

typedef struct
{
    uint16_t min;
    uint16_t max;
    uint8_t bpp;
    uint8_t reserved[3];
} x_header_t;
typedef struct
{
    uint32_t pos;
} x_table_t;
typedef struct
{
    uint8_t adv_w;
    uint8_t box_w;
    uint8_t box_h;
    int8_t ofs_x;
    int8_t ofs_y;
    uint8_t r;
} glyph_dsc_t;
static x_header_t __g_xbf_hd = {
    .min = 0x0020,
    .max = 0xff1a,
    .bpp = 4,
};
char *Font_buff = NULL;
// static uint8_t __g_font_buf[240]; //如bin文件存在SPI FLASH可使用此buff
static void init_font(void)
{
    FILE *ff = fopen("/spiffs/myFont.bin", "r");
    if (ff == NULL)
    {
        printf("Failed to open file for reading");
        return;
    }
    fseek(ff, 0, SEEK_END);
    long lSize = ftell(ff);
    rewind(ff);
    printf("Lsize %ld", lSize);
    static uint8_t first_in = 1;
    if (first_in == 1)
    {
        first_in = 0;
        Font_buff = (char *)malloc(sizeof(char) * lSize);
    }
    int br = fread(Font_buff, 1, lSize, ff);
    printf("Bytes read %d", br);
    fclose(ff);
}
static uint8_t *__user_font_getdata(int offset, int size)
{
    //如字模保存在SPI FLASH, SPIFLASH_Read(__g_font_buf,offset,size);
    //如字模已加载到SDRAM,直接返回偏移地址即可如:return (uint8_t*)(sdram_fontddr+offset);
    static uint8_t first_in = 1;
    if (first_in == 1)//第一次进入的时候初始化外部字体
    {
        first_in = 0;
        init_font();
    }
    return (uint8_t*)(Font_buff+offset);
    // return __g_font_buf;
}
static const uint8_t *__user_font_get_bitmap(const lv_font_t *font, uint32_t unicode_letter)
{
    if (unicode_letter > __g_xbf_hd.max || unicode_letter < __g_xbf_hd.min)
    {
        return NULL;
    }
    uint32_t unicode_offset = sizeof(x_header_t) + (unicode_letter - __g_xbf_hd.min) * 4;
    uint32_t *p_pos = (uint32_t *)__user_font_getdata(unicode_offset, 4);
    if (p_pos[0] != 0)
    {
        uint32_t pos = p_pos[0];
        glyph_dsc_t *gdsc = (glyph_dsc_t *)__user_font_getdata(pos, sizeof(glyph_dsc_t));
        return __user_font_getdata(pos + sizeof(glyph_dsc_t), gdsc->box_w * gdsc->box_h * __g_xbf_hd.bpp / 8);
    }
    return NULL;
}
static bool __user_font_get_glyph_dsc(const lv_font_t *font, lv_font_glyph_dsc_t *dsc_out, uint32_t unicode_letter, uint32_t unicode_letter_next)
{
    if (unicode_letter > __g_xbf_hd.max || unicode_letter < __g_xbf_hd.min)
    {
        return NULL;
    }
    uint32_t unicode_offset = sizeof(x_header_t) + (unicode_letter - __g_xbf_hd.min) * 4;
    uint32_t *p_pos = (uint32_t *)__user_font_getdata(unicode_offset, 4);
    if (p_pos[0] != 0)
    {
        glyph_dsc_t *gdsc = (glyph_dsc_t *)__user_font_getdata(p_pos[0], sizeof(glyph_dsc_t));
        dsc_out->adv_w = gdsc->adv_w;
        dsc_out->box_h = gdsc->box_h;
        dsc_out->box_w = gdsc->box_w;
        dsc_out->ofs_x = gdsc->ofs_x;
        dsc_out->ofs_y = gdsc->ofs_y;
        dsc_out->bpp = __g_xbf_hd.bpp;
        return true;
    }
    return false;
}
//AliHYAiHei-Beta,,-1
//字模高度:24
//XBF字体,外部bin文件
lv_font_t myFont = {
    .get_glyph_bitmap = __user_font_get_bitmap,
    .get_glyph_dsc = __user_font_get_glyph_dsc,
    .line_height = 24,
    .base_line = 0,
};

    LV_FONT_DECLARE(myFont);
    lv_obj_t *label = lv_label_create(obj, NULL);
    lv_obj_set_style_local_text_font(label, LV_LABEL_PART_MAIN, LV_STATE_DEFAULT, &myFont);

对于物体和文字识别:
首先要在百度智能云上获取token,然后把获取到的图像转为JPG格式,再通过base64编码和urlcode编码得到的数据以post的形式上传到百度进行识别,识别到结果后获取json数据进行解析和显示。
ESP_MASTER 语音/人脸9大功能
对于颜色识别:
ESP_MASTER 语音/人脸9大功能
将获取到的图像每一个像素点转换为HSL后腐蚀,搜索腐蚀中心,再从腐蚀中心向外腐蚀,得到新的腐蚀中心:
ESP_MASTER 语音/人脸9大功能


评论:
相关文章
ESP32 使用DAC模拟输出完成两路呼吸灯

ESP32的DAC函数可以实现真正的模拟输出。


在 ESP32 上使用 LEDC (PWM)

ESP32 没有Arduino输出 PWM 的 analogWrite(pin, value) 方法,取而代之的 ESP32 有一个 LEDC 来实现PWM功能。


Micropython基于ESP32的多线程开发

本文学习如何使用ESP32开发板来进行多线程的开发。


ESP8266 Arduino WIFI

ESP8266有三种工作模式,分别为:AP,STA,AP混合STA


ESP32 SPI

ESP32有四个SPI外设,分别为SPI0、SPI1、HSPI和VSPI。


ESP32 I2C

ESP32有2个硬件I2C总线接口,接口可以配置为主机或从机模式。


ESP32-CAM 故障排除指南:修复的最常见问题

在使用ESP32-CAM发布了一些项目后,一些读者在尝试使用 ESP32-CAM 时报告了问题。本指南汇总了使用 ESP32-CAM 时最常见的错误以及如何修复它们。


SSD1306 OLED屏的使用

本文介绍SSD1306 OLED屏在ESP32中的使用,程序为MicroPython开发。


ESP32+TFT零基础保姆级教学,一步步从接线到编程实践

本文详细介绍如何在Arduino环境中使用ESP32板,通过TFT_ESPI库,轻松地点亮TFT屏幕。


ESP32 采用u8g2库驱动OLED屏

本文介绍ESP32采用Arduino框架u8g2库驱动OLED屏显示中文。

相关创作
太阳能电子纸天气显示器具有小巧、节能环保、易于制作安装等优势。通过利用太阳能充电和低功耗设计,使得这款天气站不仅适合家庭使用,也非常适合用于商业、学校等场所。
热度:16
基于ESP32的电子墨水屏日历,支持通过 OpenWeatherMap 实现天气显示等功能。
热度:89
最新资源
小鹏STEM教研服务

专属教研服务系统,助您构建STEM课程体系,打造一站式教学环境。