Mécaniser la création ou la manipulation de texte électronique.

text-processing...

À l'origine, ma question était: J'ai des dataframe par exemple: df = pd.DataFrame({ "EmailAdds": ["pamelasilvera@gmail.com"], "Subject": ["Report submission", "Meeting update"] }) Je voulais séparer les identifiants de messagerie dans la colonne "EmailAdd....
4 juin 2020 à 18:35
J'ai les lignes ci-dessous dans un fichier Acanthocephala;Palaeacanthocephala;Polymorphida;Polymorphidae;;Profilicollis;Profilicollis_altmani; Acanthocephala;Eoacanthocephala;Neoechinorhynchida;Neoechinorhynchidae;;;; Acanthocephala;;;;;;; Acanthocephala;Palaeacanthocephala;Polymorphida;Polymorphida....
3 juin 2020 à 20:11
Je fais des exercices d'E / S de fichier Python et même si j'ai fait d'énormes progrès sur un exercice dans lequel j'essaie de trouver les mots les plus longs dans chaque ligne d'un fichier .txt, je ne peux pas me débarrasser du signes de ponctuation . Voici le code que j'ai: with open("original-3.....
J'ai ces vecteurs de chaîne text1 = " SPEECH Remarks at the European Economics and Financial Centre Remarks by Luis de Guindos, Vice-President of the ECB, at the European Economics and Financial Centre London, 2 March 2020 I am delighted to be here today at the European Economics and F' text2 = " ....
10 mai 2020 à 18:30
Ma contribution (une toute petite partie de mon document et je dois aussi utiliser ce programme sur 100 documents): 86834 SOL4504 86955 SOL5240 86963 SOL4251 SOL15 38222 SOL17 35642 SOL110 41053 Ma sortie: MGD674 SOL4504 MGD675 SOL5240 MGD675 SOL4251 SOL15 MGD297 SOL17 MGD277 SOL110 MGD319 Dans mo....
7 avril 2020 à 16:34
C'est mon script #!/bin/bash for num in {1..100}; do sed '$s/ 6.36535 23.3762512.09434/ 6.76889 21.76071 12.19032/' eq8_$num.gro | tee eq9_$num.gro done Je veux remplacer "6.36535 23.3762512.09434" par "6.76889 21.76071 12.19032" (les espaces blancs sont importants dans ce cas, les fic....
24 mars 2020 à 14:44
J'ai plusieurs fichiers au format suivant. Celui-ci a 3 séquences (le nombre de séquences varie dans tous les fichiers, mais se terminent toujours par ".") Avec 40 positions chacune, comme indiqué par les nombres de la première ligne. Depuis le début des lignes (sauf la première), il y a les noms de....
28 févr. 2020 à 21:49
Bonjour, j'essaie de faire fonctionner cette pièce de sorte que lorsque l'entrée est une chaîne telle que "aaabbbccdddeef", la sortie soit "abcdef". Je sais qu'il existe des solutions, mais cela me dérange que cela ne fonctionne pas et je ne vois pas pourquoi. J'apprécierais vraiment que quelqu'un p....
7 févr. 2020 à 07:04
C'est la question de savoir comment analyser la sortie "non analysable" en json, ou en quelque chose de facilement consommable comme json. C'est "un peu" derrière des trucs triviaux, donc j'aimerais savoir, comment résolvez-vous ces choses en principe, il ne s'agit pas uniquement de cet exemple spéc....
25 janv. 2020 à 23:44
J'ai le script perl suivant de cet échange de pile question qui convertit le contenu d'un répertoire en JSON. use File::Find; use JSON; use strict; use warnings; my $dirs={}; my $encoder = JSON->new->ascii->pretty; find({wanted => \&process_dir, no_chdir => 1 }, "."); print $encoder->encode....
5 janv. 2020 à 21:45
J'ai des textes de taille variable (caractères 1k-100k). Je veux obtenir tous les mots autour d'un mot donné à proximité fixe. Le mot donné est obtenu à partir d'une expression régulière, j'ai donc le début et la fin du mot. Par exemple: PROXIMITY_LENGTH = 10 # the fixed proximity my_text = 'some r....
18 déc. 2019 à 20:29
J'ai toujours 2 chiffres entre les deux et je veux extraire tout avant 3 donc Salvatore et tout après 2 Abdulla Par exemple, j'ai les éléments suivants: txt = "Salvatore32Abdulla" first = re.findall("^\D+", txt) last = re.search(,txt) Résultat attendu: first = 'Salvatore' last = 'Abdulla' Je peux ....
14 nov. 2019 à 19:03
J'ai une sortie txt (très moche) d'une requête SQL qui est effectuée par un système externe que je ne peux pas changer. Voici l'exemple de sortie: FruitName Owner OwnerPhone ============= ================= ============ Red Apple Sr Lorem Ipsum 123123 Yellow Banana Ms Dolor....
16 oct. 2019 à 06:18
J'utilise Linux. J'ai écrit un code qui ressemble à ceci: for x in {10..20}:{00..59}; do awk -F';' '/'"$x"'/ {y+=$7} END {print y}' Data26092019; done Comment utiliser cette commande sur plusieurs fichiers, par exemple: Data26092019 et Data27092019? Les fichiers sont comme ceci: 09:55:13;ACSEL;4.85....
7 oct. 2019 à 12:25
J'ai une chaîne comme ça: sentence = 'This is a nice day' Je veux avoir la sortie suivante: output = ['This is', 'a nice', 'day'] Dans ce cas, je divise la chaîne sur n = 3 espaces blancs ou plus et c'est pourquoi elle est divisée comme indiqué ci-dessus. Comment puis-je le faire efficacem....
13 août 2019 à 12:55
J'ai un fichier formaté comme celui-ci: Eye color <p class="ul">Eye color, color</p> <p class="ul1">blue, cornflower blue, steely blue</p> <p class="ul1">velvet brown</p> <link rel="stylesheet" href="a.css"> </> weasel <p class="ul">weasel</p> <p class="ul1">musteline</p> <link rel="stylesheet" href....
17 juil. 2019 à 04:52
J'ai un fichier qui contient une très longue chaîne de caractères et je voudrais en remplacer une sous-chaîne par Ns. Exemple: Test ABCD ABCD ABCD Je voudrais en remplacer une sous-chaîne par toutes les lettres N par la commande awk et sed, tous les caractères de l'index 5 à 8, donc la longueur tota....
11 juil. 2019 à 19:51
Je souhaite comparer chaque mot de la colonne mots aux valeurs des colonnes V1 à V576 (ligne par ligne pour chaque ligne). Si un mot de la colonne mots correspond à l'un des mots des colonnes V , remplacez le mot dans le V colonne par 1 ou bien par 0 si aucune correspondance. Une idée com....
Divisez la première colonne du fichier en deux colonnes en fonction d'un caractère. Les données entre crochets () doivent être déplacées vers la nouvelle colonne en supprimant les crochets. Fichier csv donné: Col1(col2),col3,col4,col5 a(23),12,test(1),test2 b(30),15,test1(2),test3 Fichier attendu: ....
4 juin 2019 à 14:13
Je cherche un moyen d'identifier les FASTA -fichiers avec au moins 3 séquences. Les séquences sont identifiées par des lignes commençant par >. Voici un exemple de 5 fichiers: File1 >sp1 ATTTT >sp3 ATTGG >sp3 ATTGAGGAGA >sp4 AGGGGAGGACC >sp5 AGGGGGG >sp5 AGGGGGG File2 >sp1 ATTTT File3 >sp1 ATTTT >....
24 mai 2019 à 11:25
J'ai un simple fichier xml un peu comme: <student> </student> J'utilise cette commande sed: sed -i "s/<\/student>/ <name>${1}<\/name>\ <age>${2}<\/age>\ <\/student>/g" pom.xml Pour remplacer mon xml par des données xml en utilisant la commande: ./main.sh JohnDoe 12 Et en fonction des va....
21 mai 2019 à 14:07
J'ai un fichier texte. Dans un fichier texte basé sur un mot spécifique, les données doivent être divisées en deux groupes, comme tout avant le mot spécifique comme 1 groupe et tout après le mot spécifique comme un autre groupe. Fichier texte quelque chose comme ça hello every one Is any space here....
Comment puis-je imprimer le nom avec Score uniquement lorsque la personne a un score en anglais. En d'autres termes, grepping pour 2 motifs et n'imprimez le premier et le second motif que lorsque le 2ème motif correspond. ENTRÉE: { "sessionId": "000001", ....
29 avril 2019 à 21:09
Mon objectif est d'ajouter une seule apostrophe à chaque ligne du fichier et de sauter les lignes vides. file.txt : Quote1 Quote2 Quote3 Jusqu'à présent, j'ai utilisé sed: sed -e "s/\(.*\)/'\1'/" Ce qui fait le travail mais crée des apostrophes également dans les lignes vides: 'Quote1' 'Quote2' ....
22 avril 2019 à 17:49
Je dois insérer le signe "-" moins sous la chaîne après 2 caractères puis après 3 caractères comme: mystring="223334444" Et la sortie souhaitée est comme: 22-333-4444 Je suis capable d'insérer des caractères à longueur fixe en suivant la question ci-dessous, https://unix.stackexchange.com/questions/....
10 mars 2019 à 12:49