niedziela, 20 stycznia 2008

DOM HTML'owy

DOM­ ang. Document Object Model.

DOM to model hierarchiczny. Udostępnia zestaw obiektów odzwierciedlających dokument HTML oraz elementy okna przeglądarki (window).

DOM to struktura drzewiasta, w której elementy niższego poziomu jest węzłem elementów wyższego poziomu.




NazwaOpisTypDostępność
attributesZwraca tablicę atrybutów elementu.NamedNodeMapWszystkie
childNodesZwraca tablicę węzłów potomnych elementu.NodeListWszystkie
classNamePobiera/ustawia klasę elementu.StringHTML, XUL
clientHeightZwraca wewnętrzną wysokość elementu.NumberHTML
clientWidthZwraca wewnętrzną szerokość elementu.NumberHTML
dirUstawia lub pobiera kierunek elementu.StringHTML, XUL
firstChildZwraca pierwsze dziecko bieżącego węzła lub null, jeśli ten element nie posiada węzła potomnego.NodeWszystkie
idPobiera/ustawia id elementu.StringHTML, XUL
innerHTMLPobiera/ustawia znacznik zawartości elementu.StringHTML
langOkreśla język bazowy dla wartość atrybutów i tekstowej zawartości elementu.StringHTML
lastChildZwraca ostatnie dziecko bieżącego węzła elementu lub null jeśli ten element nie posiada węzłów potomnych.NodeWszystkie
localNameZwraca lokalną część uściślonej nazwy węzła.StringWszystkie
NazwaOpisTypDostępność
namePobiera lub ustawia atrybut name - dostępne nie dla wszystkich elementów.StringHTML
namespaceURIURI przestrzeni nazw węzła lub null, jeśli jest bliżej nieokreślony.StringWszystkie
nextSiblingThe node immediately following the given one in the tree, or null if there is no sibling node.NodeWszystkie
nodeNameNazwa węzła.StringWszystkie
nodeTypeA number representing the type of the node. Is always equal to 1 for DOM elements.NumberWszystkie
nodeValueThe value of the node. Is always equal to null for DOM elements.StringWszystkie
offsetHeightThe height of an element, relative to the layout.NumberHTML
offsetLeftThe distance from this element's left border to its offsetParent's left border.NumberHTML
offsetParentThe element from which all offset calculations are currently computed.ElementHTML
offsetTopThe distance from this element's top border to its offsetParent's top border.NumberHTML
offsetWidthThe width of an element, relative to the layout.NumberHTML
ownerDocumentThe document that this node is in, or null if the node is not inside of one.DocumentWszystkie
NazwaOpisTypDostępność
parentNodeThe parent element of this node, or null if the node is not inside of a DOM Document.NodeWszystkie
prefixThe namespace prefix of the node, or null if no prefix is specified.StringWszystkie
previousSiblingThe node immediately preceding the given one in the tree, or null if there is no sibling node.NodeWszystkie
scrollHeightThe scroll view height of an element.NumberHTML
scrollLeftGets/sets the left scroll offset of an element.NumberHTML
scrollTopGets/sets the top scroll offset of an element.NumberHTML
scrollWidthThe scroll view width of an element.NumberHTML
styleAn object representing the declarations of an element's style attributes.CSSStyleHTML, XUL
tabIndexGets/sets the position of the element in the tabbing order.NumberHTML
tagNameThe name of the tag for the given element.StringWszystkie
textContentGets/sets the textual contents of an element and all its descendants.StringWszystkie


attributes
Zwraca tablicę atrybutów elementu.
childNodes
Zwraca tablicę węzłów potomnych elementu
className
Pobiera/ustawia klasę elementu.
clientHeight
Własność DHTML-a, reprezentuje wewnętrzną wysokość elementu.
clientLeft
Długość od lewego obramowania elementu wyrażona w pikselach. Aktualnie nie obsługiwana.
clientTop
Długość od górnego obramowania elementu wyrażona w pikselach. Aktualnie nie obsługiwana.
clientWidth
Własność DHTML-a, reprezentuje wewnętrzną szerokość elementu.
dir
Pobiera/ustawia kierunkowość (ang. directionality) elementu.
firstChild
Zwraca pierwsze dziecko bieżącego węzła.
id
Pobiera/ustawia id elementu.
innerHTML
innerHTML zwraca całą zawartość elementu wraz ze znacznikami.
lang
Określa język bazowy dla wartość atrybutów i tekstowej zawartości elementu.
lastChild
Zwraca ostatnie dziecko bieżącego węzła.
length
Zwraca ilość elementów listy (np. childNodes).
localName
Zwraca lokalną część uściślonej nazwy węzła.
name
Pobiera lub ustawia atrybut name - dostępne nie dla wszystkich elementów.
namespaceURI
URI przestrzeni nazw węzła lub NULL, jeśli nie określono przestrzeni nazw.
nextSibling
Zwraca węzeł bezpośrednio następny w drzewie dokumentu.
nodeName
Zwraca nazwę biężącego węzła.
nodeType
Zwraca typ bieżącego węzła.
nodeValue
Zwraca wartość bieżącego węzła.
offsetHeight
offsetHeight jest własnością DHTML-a, zwracającą wysokość elementu względem układu.
offsetLeft
offsetLeft pobiera/ustawia ilość pikseli, jaka dzieli element od lewej strony wewnątrz węzła offsetParent.
offsetParent
offsetParent zwraca referencję do obiektu, w którym obecny element się znajduje (tj. rodzica).
offsetTop
offsetTop zwraca pozycję obecnego elementu względem góry węzła offsetParent.
offsetWidth
offsetWidth jest własnością DHTML-a, zwracającą szerokość elementu względem układu.
ownerDocument
Zwraca dokument, w którym znajduje się bieżący węzeł.
parentNode
Zwraca rodzica bieżącego węzła.
prefix
Zwraca prefiks przestrzeni nazw obecnego węzła bądź NULL, jeśli nie określono przestrzeni nazw.
previousSibling
Zwraca węzeł bezpośrednio poprzedni w drzewie dokumentu.
scrollHeight
Własność DHTML-a, zwraca wysokość zawartości elementu z paskiem przewijania.
scrollLeft
Gets or sets the number of pixels that an element's content is scrolled to the left.
scrollTop
Własność DHTML-a, która ustawia bądź pobiera odległość między górą elementu a najwyższym punktem zawartości elementu z paskiem przewijania.
scrollWidth
Zwraca the width of the scroll view of an element.
style
Zwraca blok reguł stylów dla elementu.
tabIndex
Pobiera/ustawia pozycję elementu w porządku tabulacji.
tagName
Zwraca nazwę elementu.
textContent
Pobiera/ustawia zawartość tekstu elementu włączając jego potomków.

Metody

addEventListener
Pozwala zarejestrować obserwatora zdarzeń dla celu zdarzenia.
appendChild
Wstawia określony węzeł do listy węzłów dokumentu.
blur
Dezaktywuje bieżący element.
click
Wywołuje kliknięcie na elemencie.
cloneNode
Zwraca kopię bieżącego węzła.
dispatchEvent
Pozwala przekazać wywołania zdarzeń do modelu zdarzeń w implementacji DOM.
focus
Aktywuje bieżący element.
getAttribute
Zwraca wartość atrybutu o podanej nazwie.
getAttributeNS
Zwraca wartość atrybutu o podanej nazwie i przestrzeni nazw.
getAttributeNode
Zwraca atrybut elementu jako osobny węzeł.
getElementsByTagName
Zwraca elementy o podanej nazwie będące potomkami bieżącego elementu.
hasAttribute
Zwraca wartość logiczną zależnie od tego, czy element posiada atrybut o podanej nazwie.
hasAttributeNS
Zwraca wartość logiczną zależnie od tego, czy element posiada atrybut o podanej nazwie i przestrzeni nazw.
hasAttributes
Zwraca wartość logiczną zależnie od tego, czy element posiada jakiekolwiek atrybuty.
hasChildNodes
Zwraca wartość logiczną zależnie od tego, czy element posiada dzieci.
insertBefore
Metoda pozwala wstawić węzeł przed bieżącym elementem w DOM.
item
Zwraca węzeł z drzewa wg podanego indeksu.
normalize
Metoda zapisuje bieżący węzeł i całe drzewo znajdujące się wewnątrz w "znormalizowanej" formie.
removeAttribute
Usuwa atrybut elementu.
removeAttributeNode
Usuwa określony atrybut elementu.
removeChild
Usuwa węzeł potomny bieżącego elementu.
removeEventListener
Pozwala usunąć obserwatora zdarzeń z celu zdarzenia.
replaceChild
Metoda replaceChild() zastępuje węzeł potomny bieżącego elementu innym węzłem.
setAttribute
Dodaje nowy atrybut bądź zmienia wartość atrybutu bieżącego elementu.
setAttributeNS
Dodaje nowy atrybut bądź zmienia wartość atrybutu bieżącego elementu, wg podanej nazwy i przestrzeni nazw.
setAttributeNode
Dodaje nowy węzeł atrybutu do bieżącego elementu.
setAttributeNodeNS
Dodaje nowy węzeł atrybutu do bieżącego elementu wg podanej nazwy i przestrzeni nazw.
supports
Sprawdza, czy implementacja DOM pozwala na wykorzystanie konkretnej możliwości.

piątek, 4 stycznia 2008

przewidywanie w RegExp PHP

W "Uniwersalnym Słowniu Języka Polskiego" znalazłem hasła związane z przewidywaniem:



  • przewidujący liczący się z następstwami, myślący o przyszłości

  • przewidywanie to, co ktoś przewiduje, przypuszcza, czego się spodziewa, domyśla

  • przewidzieć — przewidywać
    1. przeczuć, domyślić się co będzie, co może nastąpić
    2. określić, oznaczyć coś z góry




Łącząc te definicje z zadaniami wyrażeń regularnych które w specjalny sposób opisują szukany tekst (lub szerzej części pól) otrzymamy dopasowywanie lub opisanie wyrażenia w zależności od kolejnych, przyszłych znaków.



    Operatory przewidywań
  • (?=...) pozytywne przewidywanie

  • (?=!...) negatywne przewidywanie

  • (?=<...) pozytywne przewidywanie wsteczne

  • (?=<!...) negatywne przewidywanie wsteczne



Operatory przewidywań nie powodują pochłaniania fragmentu napisów.


Przykład:
wyrażenie http(s)?://(www.)?(?!letnik.pl)
sprawdzi czy w napisie są linki do innych domen niż letnik.pl
dodając małą modyfikację można sprawdzenie poszerzyć o subdomeny:
http(s)?://(www.)?(?![a-z.]*?letnik.pl)
W ten sposób za pomocą pętli można dokonać sprawdzenia np przesyłanych danych $_POST pod kątem występowania linków zewnętrznych, policzenia ich itd...

czwartek, 3 stycznia 2008

zachłanność w RegExp PHP

Na początek definicje i przykłady:
Kwantyfikatory umożliwiają definiowanie wyrażeń regularnych, które dopasowują się do określonej liczby (zakresu) znaków, wzorców lub klas znaków.

    Przykłady:
  • {1}dokładnie jedno wystąpienie

  • {0,3}brak wystąpienia lub trzy wystąpienia

  • {,3}to co powyżej

  • {3,9}co najmniej 3, ale nie więcej niż 9 wystąpień

  • {3,}co najmniej 3 wystąpienia bez limitu



    skróty:
  • * równoznaczne z {0,}dowolna liczba wystąpień; zero lub więcej wystapień

  • + równoznaczne z {1,}wymaga najmniej jednego wystąpienia lub więcej; jeden lub więcej wystąpień

  • ? równoznaczne z {0,1}dopasowuje brak lub dokładnie jedno wystąpienie; zero lub jedno wystąpienie



Z powyższych przykładów możemy wyodrębnić pewną specyficzną grupę kwantyfikatorów charakteryzującą się "brakiem granic" lub rozległymi granicami:
*, +, ?, {n}, {n,} oraz {n,m}.
Tak określonym kwantyfikatorom nadano nazwę zachłanne.

Zachłanność powoduje dopasowywanie do maksymalnej możliwej liczby wyszukiwanych wzorców w napisie.

Aby ułatwić także znajdziemy coś odwrotnego a mianowicie dopasowanie niezachłanne.

Leniwość, wyłączenie zachłanności powoduje dopasowywanie do minimalnej możliwej liczby wyszukiwanych wzorców w napisie.

    Sposoby wyłączenia zachłanności:
  1. dodając do wyrażenia regularnego modyfikator /U

  2. dodając do kwantyfikatora ? np. *?, +?, ??, {n}?, {n,}? oraz {n,m}?



Doskonałym przykładem obrazującym działanie zachłanności jest kod html.
przykładowy kod html:
<p>raz</p> dwa trzy cztery <p>zero</p>
wyrażenie zachłanne:
<p>.*</p> spowoduje dopasowanie do całego napisu: <p>raz</p> dwa trzy cztery <p>zero</p>

wyrażenie nie zachłanne:
<p>.*?</p> spowoduje dopasowanie do części napisu: <p>raz</p>

środa, 2 stycznia 2008

modyfikatory w RegExp PHP


Wyrażenia regularne (ang. regular expressions, w skrócie regex lub regexp) to wzorce, które opisują łańcuchy symboli. Zdaniem niektórych lepszym tłumaczeniem angielskiej nazwy byłoby wyrażenia regułowe ponieważ, chodzi tu nie o regularność, a o reguły opisywane tymi wyrażeniami. Obecna nazwa jest jednak mocno zakorzeniona w literaturze informatycznej. Teoria wyrażeń regularnych jest związana z teorią tzw. języków regularnych. Wyrażenia regularne mogą określać zbiór pasujących łańcuchów, mogą również wyszczególniać istotne części łańcucha.

Dwie najpopularniejsze składnie wyrażeń regularnych to składnia uniksowa i składnia perlowa. Składnia perlowa jest znacznie bardziej rozbudowana. Jest ona używana nie tylko w języku Perl, ale także w innych językach programowania: (Ruby), bibliotece PCRE do C i w narzędziu powłoki o nazwie pcregrep (znanego też jako pgrep).

Źródło pl.wikipedia.org



To na tyle teorii o wyrażeniach regularnych zaczerpniętej z encyklopedii, dalej przejdę do dających dużo możliwości modyfikatorów...

    Modyfikatory:
  • mogą występować - nie są obowiązkowe

  • zmieniają sposób dopasowania wyrażenia



    Lista Modyfikatorów:
  1. i - nie ma znaczenia wielkość liter

  2. m - interpretacja po kolei wszystkich wersów napisu - ^ oraz $ oznaczają początek oraz koniec wersu

  3. s - . pasuje również do \n (kropka pasuje również do znaku nowej linii)

  4. x - ignorowanie białych znaków (\s), wyrażenie reg. może zawierać komentarze (komentarz jest interpretowany od znaku # do znaku końca linii)

  5. U - odwraca zachłanność kwantyfikatorów (*)

  6. u - kodowanie w utf-8

  7. A - kotwica ^ pasuje wyłącznie do początku napisu

  8. D - kotwica $ pasuje wyłącznie do końca napisu

  9. e - umożliwia używanie funkcji php (tylko preg_replace)


    Sposoby użycia:
  1. po końcowym ograniczniku wyrażenia np. '/(.*?)/s'

  2. w wyrażeniu; początek modyfikatora to (?i), ustawienie oraz usunięcie to (?i-x), samo usunięcie realizuje się przy pomocy (?-x), np. '/(?:(?i)jeden|(?-i)DWA)/' - dopasuje np. do JEDEn