Transcrições
Fluxo de integração
A integração de transcrições no sistema IndexBr ocorre de acordo com o seguinte fluxo:
- Os arquivos de programas das emissoras ativas no dashboard de programação são adicionados a fila única
- Os nós de transcrição adquirem arquivos da fila para processamento e devolvem a transcrição para a fila
- Ao receber uma transcrição associada a uma emissora a fila faz o encaminhamento para o sistema index
Consumo de transcrições a partir do Index
Uma vez no sistema Indexbr as transcrições do dia podem ser consultadas por meio de monitoramentos por utilizando endpoint:
GET /v1/monitorings/{id}/transcriptions
Monitoramentos podem ser criados no dashboard do index ou também via api:
POST /v1/monitorings
{
"name": "my_monitoring",
"queries": [
{
"condition": "must | must_not | filter | should",
"name": "my_query",
"query": "words to search"
}
]
}
Artigos produzidos a partir das transcrições podem ser integrados ao sistema utilizando a rota:
POST /v1/articles
{
"author": "That Journalist",
"extracted_date": "2024-06-05T00:00:00Z",
"media_type": "radio | tv | web | journal | social",
"origin": "Fonte de captura do artigo",
"published_date": "2024-06-05T00:00:00Z",
"setor_grid": "",
"subtitle": "My subtitle",
"text": "This article is awesome, trust me!",
"title": "My title",
"url": "https://news.frommytown.com.br/news/4321?rergs=rurgs#at_anchor"
}
Uma descrição mais abrangente dos endpoints expostos pelo sistema index pode ser encontrada na documentação da api.
Formato das transcrições
Transcrições são armazenadas seguindo o formato do exemplo:
{
"_index": "transcriptions",
"_type": "_doc",
"_id": "2IxC6Y8BQ6m1DA3NxK89",
"_score": 0.0,
"_source": {
"transcription": "metade do gás carbônico que a gente lançou atmosfera em grossa camada e faz com que a terra fique mais instituições fique mais verdade não muito se falou também sobre como",
"vtt": "none",
"srt": "none",
"json_file": "[{\"alternatives\": [{\"text\": \"metade do g\\u00e1s carb\\u00f4nico que a gente lan\\u00e7ou atmosfera em grossa camada e faz com que a terra fique mais institui\\u00e7\\u00f5es fique mais verdade n\\u00e3o muito se falou tamb\\u00e9m sobre como\", \"words\": [{\"text\": \"metade\", \"score\": \"0.31\", \"start_time\": \"0.36\", \"end_time\": \"0.93\"}, {\"text\": \"do\", \"score\": \"0.94\", \"start_time\": \"0.93\", \"end_time\": \"1.08\"}, {\"text\": \"g\\u00e1s\", \"score\": \"1.00\", \"start_time\": \"1.08\", \"end_time\": \"1.31\"}]",
"tsv": "none",
"duration": 300.04245,
"original_file_path": "/mnt/rtv-index/midiaclip/rtv-servers/mdc-rtvsrv02/tvs/local/salvador/tvband-sd/20240605/tvband-sd_2024-06-05_13-18-16.mp4",
"original_file_url": "018fe941-f409-76ba-b7fb-e3a73d63a63a",
"datetime": "2024-06-05T13:18:16Z",
"server_file": "/mnt/rtv-index/midiaclip/rtv-servers/mdc-rtvsrv02/tvs/local/salvador/tvband-sd/20240605/tvband-sd_2024-06-05_13-18-16.mp4",
"broadcaster": {
"id": 432,
"name": "TV BAND",
"broadcaster_type": "Tv",
"origin": "/mnt/rtv-index/midiaclip/rtv-servers/mdc-rtvsrv02/tvs/local/salvador/tvband-sd"
}
}
}