Transcrições

Fluxo de integração

A integração de transcrições no sistema IndexBr ocorre de acordo com o seguinte fluxo:

diagrama

  • Os arquivos de programas das emissoras ativas no dashboard de programação são adicionados a fila única
  • Os nós de transcrição adquirem arquivos da fila para processamento e devolvem a transcrição para a fila
  • Ao receber uma transcrição associada a uma emissora a fila faz o encaminhamento para o sistema index

Consumo de transcrições a partir do Index

Uma vez no sistema Indexbr as transcrições do dia podem ser consultadas por meio de monitoramentos por utilizando endpoint:

GET /v1/monitorings/{id}/transcriptions

Monitoramentos podem ser criados no dashboard do index ou também via api:

POST /v1/monitorings

{
  "name": "my_monitoring",
  "queries": [
    {
      "condition": "must | must_not | filter | should",
      "name": "my_query",
      "query": "words to search"
    }
  ]
}

Artigos produzidos a partir das transcrições podem ser integrados ao sistema utilizando a rota:

POST /v1/articles

{
  "author": "That Journalist",
  "extracted_date": "2024-06-05T00:00:00Z",
  "media_type": "radio | tv | web | journal | social",
  "origin": "Fonte de captura do artigo",
  "published_date": "2024-06-05T00:00:00Z",
  "setor_grid": "",
  "subtitle": "My subtitle",
  "text": "This article is awesome, trust me!",
  "title": "My title",
  "url": "https://news.frommytown.com.br/news/4321?rergs=rurgs#at_anchor"
}

Uma descrição mais abrangente dos endpoints expostos pelo sistema index pode ser encontrada na documentação da api.

Formato das transcrições

Transcrições são armazenadas seguindo o formato do exemplo:

{
    "_index": "transcriptions",
    "_type": "_doc",
    "_id": "2IxC6Y8BQ6m1DA3NxK89",
    "_score": 0.0,
    "_source": {
        "transcription": "metade do gás carbônico que a gente lançou atmosfera em grossa camada e faz com que a terra fique mais instituições fique mais verdade não muito se falou também sobre como",
        "vtt": "none",
        "srt": "none",
        "json_file": "[{\"alternatives\": [{\"text\": \"metade do g\\u00e1s carb\\u00f4nico que a gente lan\\u00e7ou atmosfera em grossa camada e faz com que a terra fique mais institui\\u00e7\\u00f5es fique mais verdade n\\u00e3o muito se falou tamb\\u00e9m sobre como\", \"words\": [{\"text\": \"metade\", \"score\": \"0.31\", \"start_time\": \"0.36\", \"end_time\": \"0.93\"}, {\"text\": \"do\", \"score\": \"0.94\", \"start_time\": \"0.93\", \"end_time\": \"1.08\"}, {\"text\": \"g\\u00e1s\", \"score\": \"1.00\", \"start_time\": \"1.08\", \"end_time\": \"1.31\"}]",
        "tsv": "none",
        "duration": 300.04245,
        "original_file_path": "/mnt/rtv-index/midiaclip/rtv-servers/mdc-rtvsrv02/tvs/local/salvador/tvband-sd/20240605/tvband-sd_2024-06-05_13-18-16.mp4",
        "original_file_url": "018fe941-f409-76ba-b7fb-e3a73d63a63a",
        "datetime": "2024-06-05T13:18:16Z",
        "server_file": "/mnt/rtv-index/midiaclip/rtv-servers/mdc-rtvsrv02/tvs/local/salvador/tvband-sd/20240605/tvband-sd_2024-06-05_13-18-16.mp4",
        "broadcaster": {
            "id": 432,
            "name": "TV BAND",
            "broadcaster_type": "Tv",
            "origin": "/mnt/rtv-index/midiaclip/rtv-servers/mdc-rtvsrv02/tvs/local/salvador/tvband-sd"
        }
    }
}