seanfobbe , to histodons group
@seanfobbe@fediscience.org avatar

🔔 NEW Dataset 🔔

The Corpus of Resolutions: UN Security Council (CR-UNSC)

✅ 2722 resolutions (1946-2024)
✅ All six UN languages
✅ 82 Variables
✅ Enhanced OCR
✅ Citation Data
and
✅ Formats: CSV, PDF, TXT, GraphML, BibTeX

Full dataset: https://zenodo.org/doi/10.5281/zenodo.7319780

Source Code: https://zenodo.org/doi/10.5281/zenodo.7319783

Blog: https://seanfobbe.com/posts/2024-05-06_new-dataset-corpus-of-resolutions-un-security-council/

@histodons @law @politicalscience @rstats

j_mieczni , to dh group German
@j_mieczni@101010.pl avatar

Nella gestione dei dati il problema dell' si pone a vari livelli. In questo mese su ShareTIGR rifletteremo sul formato delle trascrizioni eseguite manualmente ascoltando conversazioni audio- e videoregistrate.
Morfologia delle trascrizioni, parte I: leggibili in che modo? https://sharetigr.usi.ch/it/news/feeds/38046
Una prodotta mediante un annotatore multimediale - come ELAN, che abbiamo usato nel progetto InfinIta - contiene del codice informatico che ha bisogno di software specializzato per essere visualizzato e interpretato correttamente. Quando si trasmettono le proprie trascrizioni ad altri/e studiosi/e, conviene perciò chiedersi: Quali applicazioni useranno i/le futuri/e utenti? Quelle applicazioni sapranno leggere i documenti creati dal nostro programma di trascrizione?

@dh
@linguistics

  • All
  • Subscribed
  • Moderated
  • Favorites
  • kbinchat
  • All magazines