xml-dev - regular expressions

regular expressions

[ Lists Home | Date Index | Thread Index ]

To: xml-dev@lists.xml.org
Subject: regular expressions
From: David Tolpin <dvd@davidashen.net>
Date: Fri, 30 Jan 2004 00:02:46 +0400 (AMT)

Some schema languages use string regular expressions to check lexical space of 
attributes and character data. The regex strings often become uncomprehensible,
such as

(([a-zA-Z][0-9a-zA-Z+\-\.]*:)?/{0,2}[0-9a-zA-Z;/?:@&=+$\.\-_!~*'()%]+)?(#[0-9a-zA-Z;/?:@&=+$\.\-_!~*'()%]+)?

for any URI. 

Providing a structured syntax, similar to that for XML, would help reading and debugging
them, for example,

    s-pattern="""
      comment = "\(([^\(\)\\]|\\.)*\)"
      atom = "[a-zA-Z0-9!#$%&'*+\-/=?\^_`{|}~]+"
      atoms = atom "(\." atom ")*"
      person = "\"([^\"\\]|\\.)*\""
      location = "\[([^\[\]\\]|\\.)*\]"
      local-part = "(" atoms "|" person ")"
      domain = "(" atoms "|" location ")"
      start = "(" comment " )?" local-part "@" domain "( " comment ")?"
    """

instead of 

    pattern=
      "(\(([^\(\)\\]|\\.)*\) )?"
    ~ """([a-zA-Z0-9!#$%&'*+\-/=?\^_`{|}~]+(\.[a-zA-Z0-9!#$%&'*+\-/=?\^_`{|}~]+)*|"([^"\\]|\\.)*")"""
    ~ "@" 
    ~ "([a-zA-Z0-9!#$%&'*+\-/=?\^_`{|}~]+(\.[a-zA-Z0-9!#$%&'*+\-/=?\^_`{|}~]+)*|\[([^\[\]\\]|\\.)*\])"
    ~ "( \(([^\(\)\\]|\\.)*\))?"

Why isn't it done?

David

Follow-Ups:
- Re: [xml-dev] regular expressions
  - From: Rick Jelliffe <ricko@allette.com.au>
- Re: [xml-dev] regular expressions
  - From: Bob Foster <bob@objfac.com>
- Re: [xml-dev] regular expressions
  - From: Liam Quin <liam@w3.org>
- Re: [xml-dev] regular expressions
  - From: Joe English <jenglish@flightlab.com>

Prev by Date: RE: [xml-dev] What is your XML Editor?
Next by Date: RE: [xml-dev] hi
Previous by thread: Re: [xml-dev] hi
Next by thread: Re: [xml-dev] regular expressions
Index(es):
- Date
- Thread