xml: скопировать строку текста из одного элемента в другой?

Спасибо за помощь. Я не программист, но я понимаю основные принципы. Мне нужно сделать это в кучу файлов XML. Я уверен, что xpath pl или xtask или какая-то комбинация, использующая регулярные выражения, может это осуществить, но я потерян. У кого-нибудь есть какие-либо идеи? Спасибо!

Вот область применения:

Скопируйте элемент scc_title в элемент scc_comments. Элемент scc_comments обычно пуст. если это не так, мне все еще нужно добавить его в текущий контент.

<property name="scc_title" type="s">NEED TO COPY THIS TEXT</property>

<property name="scc_comments" type="s">AND PASTE IT HERE</property>

2 ответа

Альтернативный способ с python а также ElementTree:

from __future__ import print_function
import sys 
import xml.etree.ElementTree as ET

def main():
  if len(sys.argv) < 3:
    print("usage:", sys.argv[0], "input", "output")
    sys.exit(1)
  tree = ET.parse(sys.argv[1])
  root = tree.getroot();
  src = root.find(".//*[@name='scc_title']")
  dst = root.find(".//*[@name='scc_comments']")
  if src is not None and dst is not None:
    dst.text += src.text
    tree.write(sys.argv[2])
  else:
    if src is None:
      print("Failed to find 'scc_title' attribute", file=sys.stderr)
    if dst is None:
      print("Failed to find 'scc_comments' attribute", file=sys.stderr)
    sys.exit(1)

if __name__ == "__main__":
  main()

Pythonic non xml способ, предполагающий, что scc_title предшествует scc_comments И у каждого тега есть своя строка И что все XML-файлы находятся в одном каталоге. Я не проверял это, но это основная идея. Кроме того, я не уверен, есть ли быстрый способ с графическим интерфейсом, и я не программист, так что, вероятно, есть лучший способ сделать это с модулями xml:

#put this in the directory with the xml files
import re
import os

#for file_name in current directory "."
for file_name in os.listdir("."):

    if ".xml" in file_name:
        outfile = open("edited_"+file_name,"w+")

        with open(file_name,'r') as f:
            for line in f:

                if "scc_title" in line:
                    #split the string by two delimeters "<" and ">" and get the 3rd element starts at 0
                    scc_title_value = re.split('<|>',line)[2]

                if "scc_comments" in line:
                    scc_comments_value = re.split('<|>',line)[2]
                    #replace scc_comments_value with scc_title_value
                    line = line.replace(scc_comments_value,scc_title_value)

                outfile.write(line)
Другие вопросы по тегам