import cv2
from matplotlib import pyplot as plt
%matplotlib inline
input_img = cv2.imread("image.jpg")
plt.figure(figsize=(10,7))
plt.imshow(cv2.cvtColor(input_img, cv2.COLOR_BGR2RGB))
gray_img = cv2.cvtColor(input_img, cv2.COLOR_BGR2GRAY)
plt.figure(figsize=(10,7))
plt.imshow(cv2.cvtColor(gray_img, cv2.COLOR_BGR2RGB))
inv_gray_img = 255 - gray_img
plt.figure(figsize=(10,7))
plt.imshow(cv2.cvtColor(inv_gray_img, cv2.COLOR_BGR2RGB))
![]()
ksize=21 sigma=0 blur_img = cv2.GaussianBlur(inv_gray_img, ksize=(ksize, ksize), sigmaX=sigma, sigmaY=sigma) plt.figure(figsize=(10,7)) plt.imshow(cv2.cvtColor(blur_img, cv2.COLOR_BGR2RGB))
几行代码就搞定了,要比速度的话,那 Python+OpenCV 就没有输过。![]()
sketch_img = cv2.divide(gray_img, 255 - blur_img, scale=256) # 颜色减淡融合 plt.figure(figsize=(15,10)) plt.imshow(cv2.cvtColor(sketch_img, cv2.COLOR_BGR2RGB))
git clone https://github.com/lllyasviel/sketchKeras.git
下载权重文件 mod.h5,放到项目目录下
python keras_to_tensorflow.py --input_model="mod.h5" --output_model="mod.pb"
然后就能用 tensorboard 导入模型
mkdir logs
python3 tensorboard_graph.py
项目下生成 logs 目录就导出了计算图
tensorboard --logdir=logs/ --host=127.0.0.1
我们可以看到就是一个典型的 unet 架构,输入 [3 * 512 * 512 * 1] 不停的下采样到 [3 * 32 * 32 * 512],然后再上采样回来的过程。
from_mat = from_mat.transpose((2, 0, 1))
light_map = np.zeros(from_mat.shape, dtype=np.float)
for channel in range(3):
light_map[channel] = get_light_map_single(from_mat[channel])
light_map = normalize_pic(light_map)
light_map = resize_img_512_3d(light_map)
# 模型推理 (3, 512, 512, 1)
line_mat = mod.predict(light_map, batch_size=1)
# 去除 batch 维度 (512, 512, 3)
line_mat = line_mat.transpose((3, 1, 2, 0))[0]
# 裁剪 (512, 384, 3)
line_mat = line_mat[0:int(new_height), 0:int(new_width), :]
show_active_img_and_save('sketchKeras_colored', line_mat, 'sketchKeras_colored.jpg')
line_mat = np.amax(line_mat, 2)
# 降噪
show_active_img_and_save_denoise_filter2('sketchKeras_enhanced', line_mat, 'sketchKeras_enhanced.jpg')
show_active_img_and_save_denoise_filter('sketchKeras_pured', line_mat, 'sketchKeras_pured.jpg')
show_active_img_and_save_denoise('sketchKeras', line_mat, 'sketchKeras.jpg')
sudo apt-get install libhdf5-dev
pip install h5py
可以看到,用 sketchKeras 转换的线稿笔顺会更清晰些,而 sketchKeras_colored 包含了颜色的要素,这对后续图片上色会有很大帮助。
3D打印技术是增材制造技术,它利用计算机将需打印的物体3D模型切成一系列一定厚度的“薄片”,3D打印机自下而上地制造出每一层“薄片”,最后叠加成形出三维的实体物件。
如果要面向“赛道”类的竞速型的循路应用,那么 Jetbot 范例中的 road_following 项目会更加适合,这个项目使用图像回归(Image Regression)的深度学习技术,是一种统计学上非常有用的数学模型。
这一篇我们介绍一下在树莓派上部署 OpenVINO 神经棒,进一步提升AI的推理速度。
本文是《人工智能基础(高中版)》的读书笔记,这本书的配图非常好,把难以理解的概念图形化,所以读后感会引用书中的图片(图片版权归商汤科技所有)。
麻省理工最新发布的一项开创性研究表明,过度依赖像 ChatGPT 这样的工具,会导致认知功能大幅下降。
近日,教育部基础教育教学指导委员会正式发布《中小学人工智能通识教育指南(2025年版)》。
MaixCube 是基于Sipeed M1n 模块(主控:Kendryte K210)开发的一款集学习开发和商用一体的人脸识别产品。
本文会介绍如何使用TensorFlow Lite构建一个本地语音识别系统,内容包括语音前端处理、语音识别模型的训练以及如何将其转换为TensorFlow Lite格式并部署到ESP32。
分布最广的物联网设备往往体积很小、电量有限。它们被作为终端硬件,通过嵌入式传感器采集各种数据;计算能力有限,对功耗极为敏感。这类设备也能实现机器学习吗?