Analyse spectrale des textes: détection automatique des frontières de langue et de discours Auteur(s) : Vaillant, Pascal Nock, Richard Henry, Claudia Auteurs secondaires : Groupe de Recherche en Informatique et Mathématiques Appliquées Antilles-Guyane (GRIMAAG) ; Université des Antilles et de la Guyane (UAG) Centre de Recherche en Economie, Gestion, Modélisation et Informatique Appliquée (CEREGMIA) ; Université des Antilles et de la Guyane (UAG) ACI Jeunes Chercheurs JC 9009, 2003-2006 (Ministère de l'Enseignement Supérieur et de la Recherche, Fonds National pour la Science) : « Nouveaux paradigmes de classification : aspects théoriques et application à l'acquisition de connaissances » (Richard Nock, Pascal Vaillant) Piet Mertens, Cédrick Fairon, Anne Dister et Patrick Watrin Éditeur(s) : HAL CCSD Presses Universitaires de Louvain (distribution I6DOC/CIACO) Résumé : In French. 10 pages, 5 figures, LaTeX 2e using EPSF and custom package taln2006.sty (designed by Pierre Zweigenbaum, ATALA). Proceedings of the 13th annual French-speaking conference on Natural Language Processing: `Traitement Automatique des Langues Naturelles' (TALN 2006), Louvain (Leuven), Belgium, 10-13 April 2003 National audience We propose a theoretical framework within which information on the vocabulary of a given corpus can be inferred on the basis of statistical information gathered on that corpus. Inferences can be made on the categories of the words in the vocabulary, and on their syntactical properties within particular languages. Based on the same statistical data, it is possible to build matrices of syntagmatic similarity (bigram transition matrices) or paradigmatic similarity (probability for any pair of words to share common contexts). When clustered with respect to their syntagmatic similarity, words tend to group into sublanguage vocabularies, and when clustered with respect to their paradigmatic similarity, into syntactic or semantic classes. Experiments have explored the first of these two possibilities. Their results are interpreted in the frame of a Markov chain modelling of the corpus' generative processe(s): we show that the results of a spectral analysis of the transition matrix can be interpreted as probability distributions of words within clusters. This method yields a soft clustering of the vocabulary into sublanguages which contribute to the generation of heterogeneous corpora. As an application, we show how multilingual texts can be visually segmented into linguistically homogeneous segments. Our method is specifically useful in the case of related languages which happened to be mixed in corpora. Verbum ex machina : Actes de la 13ème conférence annuelle sur le Traitement Automatique des Langues Naturelles Louvain (Leuven), Belgium hal-00327607 https://hal.archives-ouvertes.fr/hal-00327607 ARXIV : 0810.1212 | Partager |
La crevette profonde (pandalus borealis) dans la région du nord-ouest atlantique Auteur(s) : Fontaine, Bernard Éditeur(s) : ISTPM Résumé : Introduction. L'exploitation commerciale des crustacés, et en particulier des crevettes, a connu un développement considérable à partir de 1950. L'augmentation constante des apports est liée à une demande croissante sur les marchés et l'intérêt s'est porté vers de nombreuses espèces qui ne subissaient à l'origine qu'une exploitation locale. Parmi ces espèces, Pandalus borealis, caractérisée par sa vaste distribution dans l'Atlantique nord, a reçu plusieurs noms vernaculaires. Elle est appelée "pink shrimp" ou "crevette rose" aux Etats-Unis, alors que ce terme désigne aussi bien une grande crevette du golfe du Mexique et de Guyane qu'une espèce des fonds rocheux côtiers européens. L'appellation "northern shrimp" ou "crevette nordique" est quelquefois employée dans la littérature ; ce terme très vague pourrait s'appliquer à d'autres espèces, Le nom "deep-sea prawn" ou "crevette profonde" vient de la distribution bathymétrique. En réalité, les fonds fréquentés par cette crevette sont quelquefois peu profonds, mais ce nom généralisé dans le langage scientifique international sera employé dans ce texte. La crevette profonde se présente comme un animal de plus grande taille que la "crevette rose" ou "bouquet" des côtes rocheuses européennes. Elle est armée d'un long rostre épineux mesurant près de la moitié de la longueur du corps du crustacé et sa couleur varie du rose au rouge sombre. Le caractère qui permet de la distinguer très rapidement des autres crevettes de l'Atlantique nord, est situé sur le troisième segment de l'abdomen. Ce troisième segment qui détermine la courbure de la queue porte un tubercule très visible qui ressort sur le profil supérieur, cela est très net en contre-jour (fig. 1). Science et Pêche (0036-8350) (ISTPM), 1970-11 , Vol. 197 , P. 1-14 Droits : Ifremer http://archimer.ifremer.fr/doc/1970/publication-7003.pdf http://archimer.ifremer.fr/doc/00000/7003/ | Partager |
Étude géologique et géophysique des marges continentales passives : exemple du Zaïre et de l'Angola Auteur(s) : Moulin, Maryline Éditeur(s) : Université de Bretagne Occidentale Résumé : The objective of the present work is to study the formation of the passive continental margins of the Central Segment of the South Atlantic, most particularly the Congo and Angola margins. We propose a combined approach, which integrates structural constraints based on geological cross-sections (based on seismic data) and global constraints based on plate kinematic reconstructions. The structural study is based on : i) MCS and refraction data collected during the ZaiAngo programme (a joint project conducted by Ifremer and Total) ; ii) proprietary, industrial seismic data (courtesy of Total) from the Angola margin and iii) on all available seismic lines from the Africa and Brazil conjugated margins, between Walvis Ridge and the Equatorial Fracture Zones. Based on theses data, three structural domains (continental, transitional and oceanic) have been defined, the major characteristics of which are : Crustal thinning occurs abruptly, mostly below the continental slope, over a lateral distance of less than 50 km. The top of the crust deepens as the Moho shallows. Only a few extensional structures are observed ; tilted blocks are very few (one or two, depending on the profile), found only on the upper part of the slope and sealed by a discordance prior to salt deposition. The transitional domain is characterized by the existence of a pre-salt basin lying over a thin crustal layer. No tilted blocks are observed in this domain and reflectors within the pre-salt sediment series are parallel to the base of the Aptian salt, over distances greater than 100 km, precluding the possibility of any significant deformation that would imply large horizontal motions. Two types of crust are observed in the transitional domain. "Type I" crust is found below the undeformed pre-salt sediment series located below the eastern part of the basin ; it is characterized by an upper layer of thickness greater than 5 km and a abnormal velocity layer (7.2 - 7.6 km/s), up to 6 km thick. "Type II" crust is less than 5 km thick and found below the salt compressive front that affects the western part of the basin. The salt cover is continuous (no erosion surface is observed), from the continental shelf to the western termination of the basin. Salt was not deposited in a confined environment (like in the Mediterranean), but in a shallow water, lagunal environment. This imposes the zero-level and constrains the paleo-bathymetry at the time of salt deposition, which dates the latest stage of margin formation. Understanding the formation of a margin cannot be approached without studying the homolog margin. Therefore, it is of major importance to reconstruct the closure of the ocean bordered by these homolog margins and take into account the constraints imposed by the kinematic reconstructions on the lateral motions of the lithospheric plates. In order to assess the relative position of the plates at the ocean closure (prior to crustal thinning), a global study was thus performed, integrating all geophysical and geological constraints, in the ocean and on land. The role of african intra-plate deformation and its limits and their consequences have been thoroughly studied. To juxtapose the margins of the central segment of the Southern Atlantic, it is all the margins bordering the Equatorial Atlantic that need to be adjuste precisely. The kinematic study of this last region shows that the reconstruction obtained are reliable, unambiguous with a quantifiable precision The best fitting poles (obtained using the PLACA software), show that it is impossible to close the margins beyond the superposition of the salt fronts, from the Angola and Brazil margins. The geological cross-sections based on seismic data from the homolog margins indicate that a 330 km wide basin with thin (< 12 km) crust was present at the time of the fit. This basin cannot result from horizontal movement related to pure stretching or simple shear, or any model implying conservative volume. This conclusion is consistent with the existence of presalt reflectors parallel to the salt layer wich extends to the platform: the formation of the pre-salt basin must be related to vertical motions. The scenario that we propose for the evolution of the Congo-Angola margin consist in four stages: the first phase corresponds to extensional deformation limited to the few tilted blocks observed on the upper part of the slope. During the second phase, the main crustal thinning occurs, vertical motions prevailes, resulting in the formation of the continental slope and in the subsidence of the basin. The third phase corresponds to the first stress striction: deformation is concentrated in a limited section of the basin, which corresponds to the salt compression front. A proto-oceanic crust is formed, probably composed of thinned continental crust intruded by mantle material. The second stress striction corresponds to the finale phase, resulting in oceanisation senso stricto. The evolution described shows that we can not apply conservative models for margin formation (such as McKenzie and Wernicke or any of their avatars). In order to explain this thinning, one should investigate non-conservative models (implying geochemical transformation, small scale convection, intrusion...) such as those proposed in marginal or continental basins with no horizontal movments. Ce travail de thèse aborde la formation des marges continentales passives dans le segment central de l'océan Atlantique Sud (plus particulièrement au Congo et en Angola), en intégrant une étude en coupe (étude structurale à partir des coupes sismiques) et une étude en plan (étude cinématique). L'étude structurale de la marge a été réalisée à partir des données de sismique réflexion et réfraction de la campagne Zaïango et d'une compilation de données sismiques réflexion existantes sur toutes les marges africaine et brésilienne entre les zones de fracture équatoriales et la ride de Walvis. L'interprétation de ces données a permis d'individualiser la structure de la marge en trois domaines : continental, transitionnel et océanique et de déterminer quelques points majeurs sur la structuration de la marge. L'amincissement est abrupt, localisé dans la zone de pente continentale et restreint à 50 km. La marge montre peu de structures distensives : seuls un ou deux blocs basculés sont observés en haut de pente continentale. Le domaine transitionnel est caractérisé par la géométrie particulière de la sédimentation anté-salifère, l'absence de blocs basculés et la faible épaisseur de croûte. La couche sédimentaire anté-salifère montre des réflecteurs plans jusqu'à la base du sel, continus sur 100 km, éliminant toutes possibilités de déformation du socle pendant et après son dépôt. La croûte du domaine transitionnel peut-être divisée en deux types : une croûte de type I sur laquelle se déposent les sédiments non déformés, et une croûte de type II sur laquelle se superposent les limites du « front compressif salifère » bien exprimé dans les séries postsalifères. Enfin le sel, que l'on observe depuis la plate-forme jusqu'au bassin profond, ne se dépose pas dans un bassin confiné (comme en Méditerranée) mais à un niveau proche de 0 m (ressemblant probablement à un dépôt de type lagunaire) et donne la paléo-bathymétrie au moment de son dépôt qui marque la fin de la période de formation de la marge. La compréhension de la genèse d'une marge ne peut être approchée sans son homologue. Cette simple constatation, cette évidence, montre toute l'importance que l'on doit apporter à la reconstruction cinématique initiale de l'océan qui borde ces marges homologues et aux contraintes imposées par les reconstructions cinématiques sur les mouvements horizontaux des plaques lithosphériques. Afin d'étudier la position des marges au moment de cette fermeture, c'est-à-dire avant amincissement, une étude globale intégrant l'ensemble des données disponibles, géophysiques et géologiques, océaniques et continentales, a été réalisée. Le rôle de la déformation intraplaque africaine, ses limites et leurs conséquences a, en particulier, été l'objet d'une attention poussée. Pour juxtaposer les marges du segment central, ce sont toutes les marges de l'océan Atlantique Equatorial qui doivent être ajustées précisément. L'étude cinématique réalisée de la région équatoriale montre que l'on obtient une reconstruction fiable et sans ambiguïté, avec une précision que l'on peut quantifier. Les pôles issus de cette étude (et calculés avec le Logiciel PLACA) indiquent qu'il est impossible d'obtenir une fermeture plus serrée que celle qui conduit à la superposition des fronts salifères brésilien et angolais : les coupes issues de la sismique réflexion des deux marges indiquent qu'il subsiste un bassin aminci, large de plus de 330 km et dont la croûte n'excède jamais 13 kilomètres d'épaisseur. La formation de ce bassin ne peut résulter de mouvements horizontaux, ce qui exclut un amincissement par étirement (pure stretching) ou par l'existence d'une faille de détachement (simple shear) ou par quelque modèle conservatif que ce soit. Cette constatation corrobore l'observation de la présence d'horizons anté-salifère parallèles, entre eux et au sel, couche salifère que l'on retrouve sur la plate-forme : la création de ce bassin anté-salifère ne peut être que liée à un mouvement vertical. Le schéma d'évolution que nous proposons à partir des données structurales et des contraintes cinématiques présente quatre étapes : le premier stade correspond à une phase de déformation distensive limitée aux quelques rares blocs basculés observés en haut de pente continentale. C'est durant la deuxième étape que se déroule la phase d'amincissement principal, les mouvements verticaux prévalent, aboutissant à la formation de la pente continentale et à la subsidence du bassin. La troisième phase correspond à une première striction des contraintes : la déformation se concentre sur une partie réduite du bassin, coïncidant avec le front salifère compressif. Une proto-croûte océanique se forme, probablement composée de croûte continentale amincie et intrudée de matériel mantellique. La seconde striction correspond à la phase finale de formation de la marge et aboutit à l'océanisation sensu stricto. L'étude cinématique et la description de l'évolution de la marge à partir des données sismiques montre donc que l'on ne peut envisager l'application d'un modèle de genèse des marges avec conservation de volume (type McKenzie ou Wernicke et leurs avatars) : pour expliquer l'amincissement du bassin, il faudrait probablement nous intéresser aux modèles non-conservatifs (impliquant transformation, convection à petite échelle, ...) qui sont déjà invoqués pour la formation des bassins marginaux ou continentaux, sans mouvements horizontaux. Droits : info:eu-repo/semantics/openAccess http://archimer.ifremer.fr/doc/2003/these-82.pdf http://archimer.ifremer.fr/doc/00000/82/ | Partager |
Soft Uncoupling of Markov Chains for Permeable Language Distinction: A New Algorithm Auteur(s) : Nock, Richard Vaillant, Pascal Nielsen, Frank Henry, Claudia Auteurs secondaires : Centre de Recherche en Economie, Gestion, Modélisation et Informatique Appliquée (CEREGMIA) ; Université des Antilles et de la Guyane (UAG) Groupe de Recherche en Informatique et Mathématiques Appliquées Antilles-Guyane (GRIMAAG) ; Université des Antilles et de la Guyane (UAG) Sony Computer Science Laboratory Paris (SONY CSL-Paris) ; Sony ACI Jeunes Chercheurs JC 9009, 2003-2006 (Ministère de l'Enseignement Supérieur et de la Recherche, Fonds National pour la Science) : « Nouveaux paradigmes de classification : aspects théoriques et application à l'acquisition de connaissances » (Richard Nock, Pascal Vaillant) Gerhard Brewka, Silvia Coradeschi, Anna Perini et Paolo Traverso Éditeur(s) : HAL CCSD IOS Press (Amsterdam) Résumé : 6 pages, 7 embedded figures, LaTeX 2e using the ecai2006.cls document class and the algorithm2e.sty style file (+ standard packages like epsfig, amsmath, amssymb, amsfonts...). Extends the short version contained in the ECAI 2006 proceedings. International audience Without prior knowledge, distinguishing different languages may be a hard task, especially when their borders are permeable. We develop an extension of spectral clustering -- a powerful unsupervised classification toolbox -- that is shown to resolve accurately the task of soft language distinction. At the heart of our approach, we replace the usual hard membership assignment of spectral clustering by a soft, probabilistic assignment, which also presents the advantage to bypass a well-known complexity bottleneck of the method. Furthermore, our approach relies on a novel, convenient construction of a Markov chain out of a corpus. Extensive experiments with a readily available system clearly display the potential of the method, which brings a visually appealing soft distinction of languages that may define altogether a whole corpus. ECAI 2006: 17th European Conference on Artificial Intelligence Riva del Garda, Italy hal-00327782 https://hal.archives-ouvertes.fr/hal-00327782 ARXIV : 0810.1261 | Partager |