fork download
  1. import re
  2.  
  3. # Example string with multiple phrases including some within parentheses
  4. text = "діти волонтерство, проєкти діти, гуманітарна допомога діти, допомога дітям, примусовий вивіз дітей, загинули діти, талановиті діти, діти війни, сидіння для дітей, чужих дітей не буває, діти з інвалідністю, обов`язки дітей, батьки та діти, пропали діти, розшук дітей, державна допомога на дітей, розшук дітей, Отруєння дітей, конкурс «Яскраві діти України», діти, зник підліток, підліток, підлітки, дитячі речі, статус дитини, дитячий центр, дитячий простір, дитячі топи, дитяче харчування, Дитячий одяг, дитячий табір, потонула_дитина, (бруд, голод, дитина, Балаклія), побачення з дитиной, зникла дитина, права дитини, дитина застрягла, розшук дитини, загинула дитина, пошуки дитини, Дитина випала з вікна, Дитячі табори, дитина, неповнолітній, неповнолітня"
  5.  
  6. # Regex to split by commas outside parentheses
  7. result = re.split(r',(?![^(]*\))', text)
  8.  
  9. print(result)
  10.  
Success #stdin #stdout 0.01s 7220KB
stdin
Standard input is empty
stdout
['\xd0\xb4\xd1\x96\xd1\x82\xd0\xb8 \xd0\xb2\xd0\xbe\xd0\xbb\xd0\xbe\xd0\xbd\xd1\x82\xd0\xb5\xd1\x80\xd1\x81\xd1\x82\xd0\xb2\xd0\xbe', ' \xd0\xbf\xd1\x80\xd0\xbe\xd1\x94\xd0\xba\xd1\x82\xd0\xb8 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8', ' \xd0\xb3\xd1\x83\xd0\xbc\xd0\xb0\xd0\xbd\xd1\x96\xd1\x82\xd0\xb0\xd1\x80\xd0\xbd\xd0\xb0 \xd0\xb4\xd0\xbe\xd0\xbf\xd0\xbe\xd0\xbc\xd0\xbe\xd0\xb3\xd0\xb0 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8', ' \xd0\xb4\xd0\xbe\xd0\xbf\xd0\xbe\xd0\xbc\xd0\xbe\xd0\xb3\xd0\xb0 \xd0\xb4\xd1\x96\xd1\x82\xd1\x8f\xd0\xbc', ' \xd0\xbf\xd1\x80\xd0\xb8\xd0\xbc\xd1\x83\xd1\x81\xd0\xbe\xd0\xb2\xd0\xb8\xd0\xb9 \xd0\xb2\xd0\xb8\xd0\xb2\xd1\x96\xd0\xb7 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9', ' \xd0\xb7\xd0\xb0\xd0\xb3\xd0\xb8\xd0\xbd\xd1\x83\xd0\xbb\xd0\xb8 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8', ' \xd1\x82\xd0\xb0\xd0\xbb\xd0\xb0\xd0\xbd\xd0\xbe\xd0\xb2\xd0\xb8\xd1\x82\xd1\x96 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8', ' \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8 \xd0\xb2\xd1\x96\xd0\xb9\xd0\xbd\xd0\xb8', ' \xd1\x81\xd0\xb8\xd0\xb4\xd1\x96\xd0\xbd\xd0\xbd\xd1\x8f \xd0\xb4\xd0\xbb\xd1\x8f \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9', ' \xd1\x87\xd1\x83\xd0\xb6\xd0\xb8\xd1\x85 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9 \xd0\xbd\xd0\xb5 \xd0\xb1\xd1\x83\xd0\xb2\xd0\xb0\xd1\x94', ' \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8 \xd0\xb7 \xd1\x96\xd0\xbd\xd0\xb2\xd0\xb0\xd0\xbb\xd1\x96\xd0\xb4\xd0\xbd\xd1\x96\xd1\x81\xd1\x82\xd1\x8e', ' \xd0\xbe\xd0\xb1\xd0\xbe\xd0\xb2`\xd1\x8f\xd0\xb7\xd0\xba\xd0\xb8 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9', ' \xd0\xb1\xd0\xb0\xd1\x82\xd1\x8c\xd0\xba\xd0\xb8 \xd1\x82\xd0\xb0 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8', ' \xd0\xbf\xd1\x80\xd0\xbe\xd0\xbf\xd0\xb0\xd0\xbb\xd0\xb8 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8', ' \xd1\x80\xd0\xbe\xd0\xb7\xd1\x88\xd1\x83\xd0\xba \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9', ' \xd0\xb4\xd0\xb5\xd1\x80\xd0\xb6\xd0\xb0\xd0\xb2\xd0\xbd\xd0\xb0 \xd0\xb4\xd0\xbe\xd0\xbf\xd0\xbe\xd0\xbc\xd0\xbe\xd0\xb3\xd0\xb0 \xd0\xbd\xd0\xb0 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9', ' \xd1\x80\xd0\xbe\xd0\xb7\xd1\x88\xd1\x83\xd0\xba \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9', ' \xd0\x9e\xd1\x82\xd1\x80\xd1\x83\xd1\x94\xd0\xbd\xd0\xbd\xd1\x8f \xd0\xb4\xd1\x96\xd1\x82\xd0\xb5\xd0\xb9', ' \xd0\xba\xd0\xbe\xd0\xbd\xd0\xba\xd1\x83\xd1\x80\xd1\x81 \xc2\xab\xd0\xaf\xd1\x81\xd0\xba\xd1\x80\xd0\xb0\xd0\xb2\xd1\x96 \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8 \xd0\xa3\xd0\xba\xd1\x80\xd0\xb0\xd1\x97\xd0\xbd\xd0\xb8\xc2\xbb', ' \xd0\xb4\xd1\x96\xd1\x82\xd0\xb8', ' \xd0\xb7\xd0\xbd\xd0\xb8\xd0\xba \xd0\xbf\xd1\x96\xd0\xb4\xd0\xbb\xd1\x96\xd1\x82\xd0\xbe\xd0\xba', ' \xd0\xbf\xd1\x96\xd0\xb4\xd0\xbb\xd1\x96\xd1\x82\xd0\xbe\xd0\xba', ' \xd0\xbf\xd1\x96\xd0\xb4\xd0\xbb\xd1\x96\xd1\x82\xd0\xba\xd0\xb8', ' \xd0\xb4\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd1\x96 \xd1\x80\xd0\xb5\xd1\x87\xd1\x96', ' \xd1\x81\xd1\x82\xd0\xb0\xd1\x82\xd1\x83\xd1\x81 \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb8', ' \xd0\xb4\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd0\xb8\xd0\xb9 \xd1\x86\xd0\xb5\xd0\xbd\xd1\x82\xd1\x80', ' \xd0\xb4\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd0\xb8\xd0\xb9 \xd0\xbf\xd1\x80\xd0\xbe\xd1\x81\xd1\x82\xd1\x96\xd1\x80', ' \xd0\xb4\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd1\x96 \xd1\x82\xd0\xbe\xd0\xbf\xd0\xb8', ' \xd0\xb4\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd0\xb5 \xd1\x85\xd0\xb0\xd1\x80\xd1\x87\xd1\x83\xd0\xb2\xd0\xb0\xd0\xbd\xd0\xbd\xd1\x8f', ' \xd0\x94\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd0\xb8\xd0\xb9 \xd0\xbe\xd0\xb4\xd1\x8f\xd0\xb3', ' \xd0\xb4\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd0\xb8\xd0\xb9 \xd1\x82\xd0\xb0\xd0\xb1\xd1\x96\xd1\x80', ' \xd0\xbf\xd0\xbe\xd1\x82\xd0\xbe\xd0\xbd\xd1\x83\xd0\xbb\xd0\xb0_\xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb0', ' (\xd0\xb1\xd1\x80\xd1\x83\xd0\xb4, \xd0\xb3\xd0\xbe\xd0\xbb\xd0\xbe\xd0\xb4, \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb0, \xd0\x91\xd0\xb0\xd0\xbb\xd0\xb0\xd0\xba\xd0\xbb\xd1\x96\xd1\x8f)', ' \xd0\xbf\xd0\xbe\xd0\xb1\xd0\xb0\xd1\x87\xd0\xb5\xd0\xbd\xd0\xbd\xd1\x8f \xd0\xb7 \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xbe\xd0\xb9', ' \xd0\xb7\xd0\xbd\xd0\xb8\xd0\xba\xd0\xbb\xd0\xb0 \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb0', ' \xd0\xbf\xd1\x80\xd0\xb0\xd0\xb2\xd0\xb0 \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb8', ' \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb0 \xd0\xb7\xd0\xb0\xd1\x81\xd1\x82\xd1\x80\xd1\x8f\xd0\xb3\xd0\xbb\xd0\xb0', ' \xd1\x80\xd0\xbe\xd0\xb7\xd1\x88\xd1\x83\xd0\xba \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb8', ' \xd0\xb7\xd0\xb0\xd0\xb3\xd0\xb8\xd0\xbd\xd1\x83\xd0\xbb\xd0\xb0 \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb0', ' \xd0\xbf\xd0\xbe\xd1\x88\xd1\x83\xd0\xba\xd0\xb8 \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb8', ' \xd0\x94\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb0 \xd0\xb2\xd0\xb8\xd0\xbf\xd0\xb0\xd0\xbb\xd0\xb0 \xd0\xb7 \xd0\xb2\xd1\x96\xd0\xba\xd0\xbd\xd0\xb0', ' \xd0\x94\xd0\xb8\xd1\x82\xd1\x8f\xd1\x87\xd1\x96 \xd1\x82\xd0\xb0\xd0\xb1\xd0\xbe\xd1\x80\xd0\xb8', ' \xd0\xb4\xd0\xb8\xd1\x82\xd0\xb8\xd0\xbd\xd0\xb0', ' \xd0\xbd\xd0\xb5\xd0\xbf\xd0\xbe\xd0\xb2\xd0\xbd\xd0\xbe\xd0\xbb\xd1\x96\xd1\x82\xd0\xbd\xd1\x96\xd0\xb9', ' \xd0\xbd\xd0\xb5\xd0\xbf\xd0\xbe\xd0\xb2\xd0\xbd\xd0\xbe\xd0\xbb\xd1\x96\xd1\x82\xd0\xbd\xd1\x8f']