RESUMEN
Spanish is one of the most spoken languages in the world. Its proliferation comes with variations in written and spoken communication among different regions. Understanding language variations can help improve model performances on regional tasks, such as those involving figurative language and local context information. This manuscript presents and describes a set of regionalized resources for the Spanish language built on 4-year Twitter public messages geotagged in 26 Spanish-speaking countries. We introduce word embeddings based on FastText, language models based on BERT, and per-region sample corpora. We also provide a broad comparison among regions covering lexical and semantical similarities and examples of using regional resources on message classification tasks.
RESUMEN
Osgood developed the semantic differential to bridge the phenomena from semantics and perception, and we applied its modified version to investigate current issues in cognitive science. We used two-dimensional rather than one-dimensional space to position nominal word items, and subjected data to multidimensional scaling (MDS). In Experiment 1 (paper-and-pencil) participants judged concrete and abstract nouns on seven bipolar semantic differential scales in three perceptual modalities: visual, auditory and touch. Six months later, in Experiment 2 (computer-assisted), the same participants mapped the same ten nouns on a balanced subset of two-dimensional planes. Our findings support the hypothesis that semantic space is physically constrained. MDS over one-dimensional ratings from Experiment 1 resulted in a particular two-dimensional solution. This two-dimensional combination was very similar to one of the raw two-dimensional maps from Experiment 2. We then concluded that this particular raw two-dimensional map is highly informative, as it captures almost all differences between word items in the given set of perceptual opposites. Its informativeness proved to be robust to experimental administration (paper-and-pencil vs. computer-assisted) and scale-orientations (horizontal vs. vertical). Recent theories, such as Barsalou's perceptual theory of knowledge, capture the tradition of conceptualizing all knowledge as inherently perceptual. Our results strongly support these theories.
Osgood desarrolló el diferencial semántico para investigar los fenómenos desde la semántica y la percepción, y aplicamos su versión modificada para investigar temas actuales en ciencia cognitiva. Utilizamos dos dimensiones en lugar de un espacio unidimensional para posicionar palabras nominales y datos sujetos a escalamiento multidimensional (MDS). En el experimento 1 (papel y lápiz) participantes consideraron sustantivos concretos y abstractos en siete escalas de diferencial semántico bipolar en tres modalidades per-ceptuales: visual, auditivo y táctil. Seis meses más tarde, en el Experimento 2 (asistida por ordenador), los mismos participantes asignaron los mismos diez sustantivos en un subconjunto equilibrado de planos bidimensionales. Nuestros resultados apoyan la hipótesis de que el espacio semántico está limitado físicamente. Las calificaciones unidimensionales sobre MDS del Experimento 1 dieron como resultado una solución de dos dimensiones particular. Esta combinación de dos dimensiones fue muy similar a uno de los mapas de dos dimensiones en bruto del Experimento 2. Se concluyó que este mapa particular de dos dimensiones es altamente informativo, ya que captura casi todas las diferencias entre las palabras en el conjunto dado de los opuestos perceptuales. Esta información demostró ser sólida a la administración experimental (papel y lápiz versus asistida por computador) y las orientaciones de la escala (horizontal y vertical). Teorías recientes, como la teoría del conocimiento perceptual de Barsalou, captura la tradición de la conceptualización del conocimiento como inherentemente perceptual. Nuestros resultados apoyan firmemente estas teorías.