特征提取与判断:识别选民的选择意图
根据选票标记类型(填涂、勾选、手写符号等),算法采用不同的特征提取策略:
(1)填涂标记识别(常见场景)
面积占比法:计算填涂框内黑色像素占比,超过阈值(如 30%-50%)则判定为有效选择。
例:选民使用 2B 铅笔填涂候选人 A 的方框,扫描后该区域黑色像素占比达 45%,算法判定为有效投票。
边缘检测法:通过 Canny 或 Sobel 算子检测填涂区域的边缘轮廓,与标准填涂形状(如矩形、圆形)比对,排除不规则标记(如笔尖打滑形成的短线)。
浓度梯度分析:填涂越均匀的区域,灰度值分布越集中,算法可通过统计像素灰度方差来区分 “认真填涂” 与 “轻微触碰”。
(2)勾选或手写符号识别
形态学分析:通过膨胀、腐蚀等形态学运算,将勾选符号(√)或手写标记(如 “○”)转换为标准形状,再与预设模板匹配。
方向特征提取:对于斜线标记(如 “/”),计算像素分布的梯度方向,判断是否符合 “勾选” 的典型角度(如 45° 或 135°)。
(3)异常标记检测
多选判定:同一候选区域内检测到多个标记(如同时填涂两个候选人框),或单票标记数超过规定(如总统选举多选 1 人),则判定为无效票。
空白票识别:所有候选区域标记面积均低于阈值,判定为未投票。
4. 结果验证与输出:确保计数准确性
重复校验:对关键标记区域进行多次扫描(如两次独立图像采集),结果一致才确认有效。
人工复核接口:对算法判定存疑的选票(如填涂面积接近阈值、标记形状模糊),生成图像供选举工作人员人工审核(如美国部分州要求对 “争议票” 进行人工查验)。
数据输出:将识别结果转换为结构化数据(如候选人 ID、得票数),同步至中央数据库或打印纸质统计表。
系统介绍:
投票选举系统(扫描仪版)与电子投票箱计票原理一致,具有更轻便、灵活的特点。适用于小型选举会议、分团选举或其他投票地点不集中的场景。
民主选举,特别是无记名投票,一般要具有机密性、性、可靠性、准确性、实用性和易操作性。
在企事业单位中,民主选举需要处理大量的数据。如果用人工去处理,不但费时费力,而且难以做好真实、公平,这些工作的成果也缺乏说服力。
如果采用高速扫描仪智能识别来读卡,然后配合能对数据作分析处理的投票选举统计软件,组成民主投票选举系统,不仅能大大降低统计得票数和有效票据的工作量,省时省力、快速准确,还能够消除投票人的思想顾虑,和减少其它不必要的人为因素干扰,使选举符合公平、公正、公开的标准。
采用高速扫描仪读选票的方式。现场联机阅读,多种选票混读。使用方便、识别准确,准确率,无误差。阅读、统计速度快。 在软件读卡过程中,可以根据用户的设定设置为多选无效、不选弃票等选项,自动统计总票数多少、有效票多少。可根据用户需求定义涂卡图像的识别如“√”、“O”。
全流程质量控制节点
阶段 具体措施
选举前 - 模拟测试:用至少 1000 张包含各类边缘场景的模拟选票(如重度折叠票、墨水渗透票、轻微填涂票)进行压力测试,识别错误率需<0.01% 方可上线。
- 第三方认证:通过国际标准(如美国 FEC 的投票系统认证、ISO 25010 软件质量模型)的合规性审计。
选举中 - 实时异常报警:当连续 5 张选票出现 “多选” 或 “空白票” 比例超过历史均值 2 倍时,系统自动暂停并提示工作人员检查(如巴西大选读票机的实时监控 dashboard)。
- 双人员工值守:每台读票机需 2 名选举工作人员同时在场,一人操作、一人复核,避免单人误操作。
选举后 - 人工抽样审计:按选区随机抽取 5%-10% 的纸质选票与扫描数据比对,误差率超过 0.5% 时启动全量重新计票(如 2020 年美国亚利桑那州审计中,人工复核 5000 张选票,机器计数准确率为 99.87%)。
- 审计日志留存:记录每台读票机的开机时间、扫描张数、异常处理记录等,保存至少 22 个月(符合美国 HAVA 法案要求)。
争议票处理机制
可视化复核界面:读票机软件提供选票图像放大、灰度值可视化工具(如用热力图显示填涂浓度),工作人员可手动标记 “有效”“无效” 或 “待确认”(如加拿大联邦选举中,人工复核团队通过专用软件处理争议票)。
多轮仲裁流程:对人工复核仍存争议的选票(如填涂面积刚好卡在阈值边缘),由选区选举委员会 3 名成员投票决定,需至少 2 票同意方可判定有效性。