Please provide the changes or the diff of the files you would like me to summarize.

This commit is contained in:
Mint_Envy13 2026-03-31 19:37:19 +09:00
parent ee3da13e0e
commit 2fb73ddd22
3 changed files with 234 additions and 7 deletions

View File

@ -0,0 +1,20 @@
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch010",
"recording_type": "unknown",
"snr_db": 23.700000762939453,
"noise_floor_db": -68.0999984741211,
"file_name": "0326-10_ch010.wav",
"start_ms": 88000,
"end_ms": 91840,
"duration_sec": 5.34,
"stt_raw": "네, 2186 열차 스카프 3연 가겠습니다",
"stt_candidates": [
"네, 2186 열차 스카프 3연 가겠습니다"
],
"transcription": "네, 2186열차 열차 스카프 3연 가겠습니다",
"speaker": "기관사",
"confidence": "high",
"reason": "4자리 숫자 2186→2186열차. 기관사 자기소개 및 행동 보고 패턴 → 기관사",
"verified": false
}

Binary file not shown.

View File

@ -1,9 +1,10 @@
{
"_generated": "2026-03-31 19:26:50",
"total_files": 43,
"total_utterances": 310,
"_generated": "2026-03-31 19:37:13",
"total_files": 44,
"total_utterances": 320,
"processed_files": [
"0326-1.opus",
"0326-10.opus",
"0528.opus",
"0611.opus",
"0637.opus",
@ -50,15 +51,15 @@
"recording_type_stats": {
"linein": 0,
"mic": 0,
"unknown": 1
"unknown": 11
},
"snr_stats": {
"mean": 0.1,
"mean": 0.8,
"min": 0,
"max": 25.2,
"max": 28.2,
"above_80": 0,
"above_30": 0,
"below_30": 310
"below_30": 320
},
"utterances": [
{
@ -5626,6 +5627,212 @@
"confidence": "high",
"reason": "기관사 응답 패턴 ('예 + 복창 + 수신') 및 '수고하십시오' 발화 규칙 적용.",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch001",
"recording_type": "unknown",
"snr_db": 17.5,
"noise_floor_db": -67.0,
"file_name": "0326-10_ch001.wav",
"start_ms": 7680,
"end_ms": 15648,
"duration_sec": 9.47,
"stt_raw": "전체범위, 서면 상선의 1110, 선로차, 31편성입니다. 유실물 있는데 공의가 안 나왔네요. 출고 가겠습니다.",
"stt_candidates": [
"전체범위, 서면 상선의 1110, 선로차, 31편성입니다. 유실물 있는데 공의가 안 나왔네요. 출고 가겠습니다.",
"전체범위, 서면상선의 1110, 선로차, 31편성입니다. 유실물 있는데 공이가 안나왔네요. 출고가겠습니다."
],
"transcription": "전철 범일, 서면상선의 1110열차, 기관사, 31편성입니다. 유실물 입고 안나왔네요. 출고가겠습니다.",
"speaker": "기관사",
"confidence": "?",
"reason": "유실물 보고 패턴 (열번+편성 표현) 및 '출고' 행동 → 기관사",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch002",
"recording_type": "unknown",
"snr_db": 28.200000762939453,
"noise_floor_db": -67.4000015258789,
"file_name": "0326-10_ch002.wav",
"start_ms": 16160,
"end_ms": 19424,
"duration_sec": 4.76,
"stt_raw": "예, 1173년차 일단 가지고 가십시오",
"stt_candidates": [
"예, 1173년차 일단 가지고 가십시오"
],
"transcription": "예, 1173열차년차 일단 입고 가십시오",
"speaker": "기관사",
"confidence": "high",
"reason": "STT 오인식: '가'는 기관사가 관제를 호출하는 '가'를 잘못 인식하여 '가십시오'로 생성. 실제 문맥상 기관사가 관제에게 보고하고 있음을 나타내는 '가' (발차/출고) 를 사용해야 함.",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch003",
"recording_type": "unknown",
"snr_db": 15.5,
"noise_floor_db": -67.5999984741211,
"file_name": "0326-10_ch003.wav",
"start_ms": 23296,
"end_ms": 27744,
"duration_sec": 5.95,
"stt_raw": "아, 최서, 가겠습니다",
"stt_candidates": [
"아, 최서, 가겠습니다",
"아, 최서, 가겠습니다."
],
"transcription": ", 최서, 가겠습니다.",
"speaker": "기관사",
"confidence": "high",
"reason": "STT 오인식: '가'→'가', 띄어쓰기 및 문장 완성도 교정. 기관사 보고 패턴 (발차 행동)",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch004",
"recording_type": "unknown",
"snr_db": 26.0,
"noise_floor_db": -67.5999984741211,
"file_name": "0326-10_ch004.wav",
"start_ms": 28256,
"end_ms": 32320,
"duration_sec": 5.56,
"stt_raw": "1173 신용카드 일단 챙겨서 가십시오",
"stt_candidates": [
"1173 신용카드 일단 챙겨서 가십시오",
"1173 신용카드 일단 챙겨서 가십시오."
],
"transcription": "1173열차 신용카드 일단 챙겨서 가십시오.",
"speaker": "기관사",
"confidence": "high",
"reason": "STT 후보 중 '가십시오'는 기관사가 관제에게 지시하는 명령형으로, 전철 교신 도메인 패턴에 해당합니다.",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch005",
"recording_type": "unknown",
"snr_db": 16.299999237060547,
"noise_floor_db": -68.0,
"file_name": "0326-10_ch005.wav",
"start_ms": 33984,
"end_ms": 36000,
"duration_sec": 3.52,
"stt_raw": "네, 수신했습니다",
"stt_candidates": [
"네, 수신했습니다"
],
"transcription": "네, 수신했습니다.",
"speaker": "기관사",
"confidence": "high",
"reason": "기관사 응답 패턴 (수신 확인) → 기관사",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch006",
"recording_type": "unknown",
"snr_db": 25.399999618530273,
"noise_floor_db": -67.0999984741211,
"file_name": "0326-10_ch006.wav",
"start_ms": 50304,
"end_ms": 58496,
"duration_sec": 9.69,
"stt_raw": "설면상선 출발한 1173열차는 심평에서 내리시죠. 나중에 교대기관사한테 유실물 넘겨주십시오.",
"stt_candidates": [
"설면상선 출발한 1173열차는 심평에서 내리시죠. 나중에 교대기관사한테 유실물 넘겨주십시오.",
"설명상선 출발한 1173열차는 심평에서 내리시죠. 나중에 교대기관사한테 유실물 넘겨주십시오."
],
"transcription": "설면상선 출고 1173열차는 신평에서 내리시죠. 나중에 교대기관사한테 유실물 넘겨 주십시오.",
"speaker": "관제",
"confidence": "high",
"reason": "STT 오인식: '설면'→'설면', '교대'→'교대'. 문장 구조와 관제 지시 패턴 (유실물 처리)에 따라 기관사가 아닌 관제로 판단.",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch007",
"recording_type": "unknown",
"snr_db": 21.700000762939453,
"noise_floor_db": -67.5,
"file_name": "0326-10_ch007.wav",
"start_ms": 61632,
"end_ms": 64448,
"duration_sec": 4.32,
"stt_raw": "네, 유실물 인기하겠습니다",
"stt_candidates": [
"네, 유실물 인기하겠습니다"
],
"transcription": "네, 유실물 인기하겠습니다",
"speaker": "기관사",
"confidence": "high",
"reason": "유실물 발견 보고 패턴 (전철 범일 + 위치 + 열번+편성 + 유실물) → 기관사",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch008",
"recording_type": "unknown",
"snr_db": 23.799999237060547,
"noise_floor_db": -67.5999984741211,
"file_name": "0326-10_ch008.wav",
"start_ms": 75040,
"end_ms": 81408,
"duration_sec": 7.87,
"stt_raw": "전철 범일 다대회차선은 2168열차 유실물 스카프 하나 있습니다.",
"stt_candidates": [
"전철 범일 다대회차선은 2168열차 유실물 스카프 하나 있습니다.",
"전철 범일, 다대회차선, 2168열차, 유실물, 스카프 하나 있습니다."
],
"transcription": "전철 범일, 하회차선 2168열차 유실물 스카프 하나 있습니다.",
"speaker": "기관사",
"confidence": "high",
"reason": "유실물 발견 보고 패턴 (열번+편성 표현 변형도 있음) → 기관사",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch009",
"recording_type": "unknown",
"snr_db": 25.200000762939453,
"noise_floor_db": -67.80000305175781,
"file_name": "0326-10_ch009.wav",
"start_ms": 81984,
"end_ms": 86176,
"duration_sec": 5.69,
"stt_raw": "2186년, 스카프 설명 가겠습니다",
"stt_candidates": [
"2186년, 스카프 설명 가겠습니다",
"2186년, 스카프 설명 가겠습니다."
],
"transcription": "2186열차년, 스카프 설명 가겠습니다.",
"speaker": "기관사",
"confidence": "high",
"reason": "STT 오인식: '년'은 '열차'로 교정. 기관사 자기소개/보고 패턴에 해당.",
"verified": false
},
{
"source_file": "0326-10.opus",
"chunk_name": "0326-10_ch010",
"recording_type": "unknown",
"snr_db": 23.700000762939453,
"noise_floor_db": -68.0999984741211,
"file_name": "0326-10_ch010.wav",
"start_ms": 88000,
"end_ms": 91840,
"duration_sec": 5.34,
"stt_raw": "네, 2186 열차 스카프 3연 가겠습니다",
"stt_candidates": [
"네, 2186 열차 스카프 3연 가겠습니다"
],
"transcription": "네, 2186열차 열차 스카프 3연 가겠습니다",
"speaker": "기관사",
"confidence": "high",
"reason": "4자리 숫자 2186→2186열차. 기관사 자기소개 및 행동 보고 패턴 → 기관사",
"verified": false
}
]
}