"WIA 감정 AI 표준은 정서 컴퓨팅 시스템을 위한 포괄적인 프레임워크를 제공합니다. 데이터 형식에서 실시간 스트리밍, 도메인별 통합까지 모든 것을 다루는 4단계 아키텍처입니다."
WIA 감정 AI 표준은 4개의 연속적인 단계로 구성되며, 각 단계는 이전 단계를 기반으로 합니다:
| 단계 | 명칭 | 설명 | 핵심 컴포넌트 |
|---|---|---|---|
| Phase 1 | 감정 데이터 형식 | 감정 데이터 표현을 위한 JSON 스키마 | EmotionEvent, ActionUnit, ModalityData |
| Phase 2 | API 인터페이스 | 감정 분석을 위한 REST API 사양 | 분석 엔드포인트, 인증, 오류 처리 |
| Phase 3 | 스트리밍 프로토콜 | 실시간 감정 스트리밍을 위한 WebSocket | 세션 관리, 이벤트 스트림, 연결 처리 |
| Phase 4 | 통합 | 도메인별 통합 가이드라인 | 헬스케어, 교육, 마케팅, 자동차 |
┌─────────────────────────────────────────────────────────────────┐ │ Phase 4: 통합 │ │ 헬스케어 | 교육 | 마케팅 | 자동차 │ ├─────────────────────────────────────────────────────────────────┤ │ Phase 3: 스트리밍 프로토콜 │ │ WebSocket | 이벤트 스트림 | 세션 │ ├─────────────────────────────────────────────────────────────────┤ │ Phase 2: API 인터페이스 │ │ REST API | 인증 | 엔드포인트 | 오류 처리 │ ├─────────────────────────────────────────────────────────────────┤ │ Phase 1: 감정 데이터 형식 │ │ JSON 스키마 | 감정 분류 | AU 코드 │ └─────────────────────────────────────────────────────────────────┘
조직은 자신의 필요에 따라 표준을 구현할 수 있습니다:
WIA 표준은 Paul Ekman의 6가지 기본 감정을 기초로 사용합니다. 이 모델은 가장 널리 연구되고 검증된 감정 분류 체계입니다.
| 감정 | 영어 | 특징적 표현 | 관련 AU |
|---|---|---|---|
| 😊 행복 | Happiness | 미소, 눈가 주름 | AU6, AU12 |
| 😢 슬픔 | Sadness | 눈썹 내림, 입 꼬리 내림 | AU1, AU4, AU15 |
| 😠 분노 | Anger | 눈썹 모음, 입술 압박 | AU4, AU5, AU7, AU23 |
| 😨 두려움 | Fear | 눈썹 올림, 눈 확장 | AU1, AU2, AU4, AU5, AU20 |
| 🤢 혐오 | Disgust | 코 주름, 윗입술 올림 | AU9, AU15, AU16 |
| 😲 놀람 | Surprise | 눈썹 올림, 입 벌림 | AU1, AU2, AU5, AU26 |
WIA 표준은 6가지 기본 감정 외에도 추가 감정을 지원합니다:
{
"emotion_categories": {
"basic_six": [
"happiness", "sadness", "anger",
"fear", "disgust", "surprise"
],
"extended": [
"neutral",
"contempt",
"confusion",
"interest",
"boredom",
"frustration",
"excitement",
"anxiety"
],
"complex": [
"embarrassment",
"pride",
"shame",
"guilt",
"jealousy",
"love",
"hope",
"relief"
]
}
}
각 감정은 0.0에서 1.0 사이의 강도 값으로 표현됩니다:
| 강도 범위 | 설명 | 예시 (행복) |
|---|---|---|
| 0.0 - 0.2 | 미묘함 | 약간의 미소 |
| 0.2 - 0.4 | 경미함 | 가벼운 기쁨 |
| 0.4 - 0.6 | 보통 | 명확한 행복 |
| 0.6 - 0.8 | 강함 | 큰 기쁨 |
| 0.8 - 1.0 | 매우 강함 | 환희, 폭소 |
이산 감정과 함께 WIA 표준은 James Russell의 차원 모델을 지원합니다. 이 모델은 감정을 2차원 공간에서 표현합니다.
높은 각성 (High Arousal)
│
│
불안 ────────────┼──────────── 흥분
(Anxiety) │ (Excitement)
│
│
──────────────────┼──────────────────
낮은 Valence │ 높은 Valence
(부정적) │ (긍정적)
│
│
우울 ────────────┼──────────── 평온
(Depression) │ (Calm)
│
│
낮은 각성 (Low Arousal)
| 차원 | 범위 | 설명 |
|---|---|---|
| Valence (감정가) | -1.0 ~ +1.0 | 감정의 긍정성/부정성. 부정(-1)에서 긍정(+1) |
| Arousal (각성도) | 0.0 ~ 1.0 | 감정의 활성화 수준. 평온(0)에서 고조(1) |
| Dominance (지배력) | 0.0 ~ 1.0 | 통제감. 무력(0)에서 완전한 통제(1) |
이산 감정을 차원 공간에 매핑할 수 있습니다:
{
"emotion_mapping": {
"happiness": {
"valence": 0.8,
"arousal": 0.6,
"dominance": 0.7
},
"sadness": {
"valence": -0.7,
"arousal": 0.3,
"dominance": 0.3
},
"anger": {
"valence": -0.6,
"arousal": 0.8,
"dominance": 0.7
},
"fear": {
"valence": -0.8,
"arousal": 0.7,
"dominance": 0.2
},
"disgust": {
"valence": -0.7,
"arousal": 0.5,
"dominance": 0.6
},
"surprise": {
"valence": 0.1,
"arousal": 0.8,
"dominance": 0.5
},
"neutral": {
"valence": 0.0,
"arousal": 0.3,
"dominance": 0.5
}
}
}
FACS(Facial Action Coding System)는 Paul Ekman과 Wallace Friesen이 1978년에 개발한 얼굴 표정 분류 시스템입니다.
FACS는 얼굴 움직임을 개별 근육 동작인 Action Unit(AU)으로 분해합니다:
| AU 코드 | 명칭 | 설명 | 관련 근육 |
|---|---|---|---|
| AU1 | Inner Brow Raiser | 눈썹 안쪽 올림 | Frontalis (pars medialis) |
| AU2 | Outer Brow Raiser | 눈썹 바깥쪽 올림 | Frontalis (pars lateralis) |
| AU4 | Brow Lowerer | 눈썹 내림 | Corrugator supercilii |
| AU5 | Upper Lid Raiser | 위 눈꺼풀 올림 | Levator palpebrae |
| AU6 | Cheek Raiser | 볼 올림 | Orbicularis oculi |
| AU7 | Lid Tightener | 눈꺼풀 조임 | Orbicularis oculi |
| AU9 | Nose Wrinkler | 코 주름 | Levator labii superioris |
| AU10 | Upper Lip Raiser | 윗입술 올림 | Levator labii superioris |
| AU12 | Lip Corner Puller | 입 꼬리 당김 | Zygomaticus major |
| AU15 | Lip Corner Depressor | 입 꼬리 내림 | Depressor anguli oris |
| AU17 | Chin Raiser | 턱 올림 | Mentalis |
| AU20 | Lip Stretcher | 입술 늘림 | Risorius |
| AU23 | Lip Tightener | 입술 조임 | Orbicularis oris |
| AU24 | Lip Pressor | 입술 누름 | Orbicularis oris |
| AU25 | Lips Part | 입술 벌림 | Depressor labii |
| AU26 | Jaw Drop | 턱 내림 | Masseter, Temporalis |
FACS는 AU 강도를 A-E 스케일로 측정합니다. WIA 표준은 이를 0-1 범위로 정규화합니다:
{
"au_intensity_mapping": {
"A": {"label": "Trace", "range": [0.0, 0.2]},
"B": {"label": "Slight", "range": [0.2, 0.4]},
"C": {"label": "Marked", "range": [0.4, 0.6]},
"D": {"label": "Severe", "range": [0.6, 0.8]},
"E": {"label": "Maximum", "range": [0.8, 1.0]}
}
}
{
"action_units": [
{
"au": "AU6",
"name": "Cheek Raiser",
"intensity": 0.75,
"confidence": 0.92
},
{
"au": "AU12",
"name": "Lip Corner Puller",
"intensity": 0.82,
"confidence": 0.95
}
],
"facs_code": "6D+12D",
"interpretation": {
"genuine_smile": true,
"duchenne_indicator": "AU6 presence"
}
}
WIA 표준은 4가지 주요 감정 감지 모달리티를 지원합니다:
| 입력 | 비디오 프레임, 이미지 |
| 분석 대상 | 표정, 미세표정, AU, 머리 자세, 시선 |
| 기술 | 컴퓨터 비전, CNN, 랜드마크 검출 |
| 장점 | 비침습적, 실시간 가능, 시각적 직관성 |
| 한계 | 가림, 조명, 문화적 차이 |
| 입력 | 오디오 스트림, 녹음 파일 |
| 분석 대상 | 피치, 톤, 속도, 강도, 멜 스펙트로그램 |
| 기술 | 음성 인식, 운율 분석, 딥러닝 |
| 장점 | 원격 분석 가능, 언어 독립적 가능 |
| 한계 | 배경 소음, 악센트 다양성 |
| 입력 | 텍스트 콘텐츠, 채팅, 문서 |
| 분석 대상 | 어휘, 구문, 맥락, 이모지, 감성 |
| 기술 | NLP, 감성 분석, Transformer 모델 |
| 장점 | 비실시간 분석 용이, 대규모 처리 가능 |
| 한계 | 풍자, 아이러니, 맥락 의존성 |
| 입력 | 심박수, EDA, EEG, 호흡, 체온 |
| 분석 대상 | HRV, 피부 전도도, 뇌파 패턴 |
| 기술 | 바이오센서, 웨어러블, 신호 처리 |
| 장점 | 무의식적 반응, 위장 어려움 |
| 한계 | 하드웨어 필요, 개인차 큼 |
{
"multimodal_config": {
"modalities": ["facial", "voice", "text", "biosignal"],
"fusion_strategy": "late_fusion",
"modality_weights": {
"facial": 0.35,
"voice": 0.25,
"text": 0.20,
"biosignal": 0.20
},
"conflict_resolution": "weighted_average",
"minimum_modalities": 2,
"fallback_modality": "facial"
}
}
┌─────────────────────────────────────────────────────────────┐ │ WIA 감정 AI 표준 │ ├─────────────────────────────────────────────────────────────┤ │ │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ 감정 모델 │ │ AU 인코딩 │ │ 차원 모델 │ │ │ │ (6+확장) │ │ (FACS) │ │ (V-A-D) │ │ │ └─────────────┘ └─────────────┘ └─────────────┘ │ │ │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ JSON 스키마 │ │ REST API │ │ WebSocket │ │ │ │ (Phase 1) │ │ (Phase 2) │ │ (Phase 3) │ │ │ └─────────────┘ └─────────────┘ └─────────────┘ │ │ │ │ ┌─────────────────────────────────────────────────┐ │ │ │ 도메인 통합 (Phase 4) │ │ │ │ 헬스케어 | 교육 | 마케팅 | 자동차 | IoT │ │ │ └─────────────────────────────────────────────────┘ │ │ │ └─────────────────────────────────────────────────────────────┘
| 레벨 | 명칭 | 요구사항 |
|---|---|---|
| 1 | Compliant | Phase 1 데이터 형식 준수 |
| 2 | Certified | Phase 1-2, API 상호운용성, 기본 정확도 |
| 3 | Certified Plus | Phase 1-4, 고급 정확도, 윤리 감사 통과 |
WIA 감정 AI 표준은 포괄적인 4단계 아키텍처를 제공합니다:
표준은 에크만의 이산 감정 모델, Russell의 차원 모델, FACS AU 인코딩을 결합하여 감정을 정확하고 세밀하게 표현합니다.
홍익인간 (弘益人間): 널리 인간을 이롭게 하라
표준화된 접근 방식을 통해 모든 이해관계자가 혜택을 받을 수 있습니다.