xml: скопировать строку текста из одного элемента в другой?
Спасибо за помощь. Я не программист, но я понимаю основные принципы. Мне нужно сделать это в кучу файлов XML. Я уверен, что xpath pl или xtask или какая-то комбинация, использующая регулярные выражения, может это осуществить, но я потерян. У кого-нибудь есть какие-либо идеи? Спасибо!
Вот область применения:
Скопируйте элемент scc_title в элемент scc_comments. Элемент scc_comments обычно пуст. если это не так, мне все еще нужно добавить его в текущий контент.
<property name="scc_title" type="s">NEED TO COPY THIS TEXT</property>
<property name="scc_comments" type="s">AND PASTE IT HERE</property>
2 ответа
Альтернативный способ с python
а также ElementTree
:
from __future__ import print_function
import sys
import xml.etree.ElementTree as ET
def main():
if len(sys.argv) < 3:
print("usage:", sys.argv[0], "input", "output")
sys.exit(1)
tree = ET.parse(sys.argv[1])
root = tree.getroot();
src = root.find(".//*[@name='scc_title']")
dst = root.find(".//*[@name='scc_comments']")
if src is not None and dst is not None:
dst.text += src.text
tree.write(sys.argv[2])
else:
if src is None:
print("Failed to find 'scc_title' attribute", file=sys.stderr)
if dst is None:
print("Failed to find 'scc_comments' attribute", file=sys.stderr)
sys.exit(1)
if __name__ == "__main__":
main()
Pythonic non xml способ, предполагающий, что scc_title предшествует scc_comments И у каждого тега есть своя строка И что все XML-файлы находятся в одном каталоге. Я не проверял это, но это основная идея. Кроме того, я не уверен, есть ли быстрый способ с графическим интерфейсом, и я не программист, так что, вероятно, есть лучший способ сделать это с модулями xml:
#put this in the directory with the xml files
import re
import os
#for file_name in current directory "."
for file_name in os.listdir("."):
if ".xml" in file_name:
outfile = open("edited_"+file_name,"w+")
with open(file_name,'r') as f:
for line in f:
if "scc_title" in line:
#split the string by two delimeters "<" and ">" and get the 3rd element starts at 0
scc_title_value = re.split('<|>',line)[2]
if "scc_comments" in line:
scc_comments_value = re.split('<|>',line)[2]
#replace scc_comments_value with scc_title_value
line = line.replace(scc_comments_value,scc_title_value)
outfile.write(line)