Вопрос по php, xml, validation – Проверяйте XML с помощью специального DTD в PHP

11

Есть ли способ (без установки каких-либо библиотек) проверки XML с использованием специального DTD в PHP?

Увидетьstackoverflow.com/questions/1274173/… MPV
Так что, просто чтобы уточнить - делает ли "пользовательский DTD"? означает «DTD, который является независимым / отличным от любого DTD, который может быть указан в содержимом XML-файла»? Peter

Ваш Ответ

4   ответа
3

обертка данных для dtd:

$xml = '<?xml version="1.0"?>
        <!DOCTYPE note SYSTEM "note.dtd">
        <note>
            <to>Tove</to>
            <from>Jani</from>
            <heading>Reminder</heading>
            <body>Don\'t forget me this weekend!</body>
        </note>';

$dtd = '<!ELEMENT note (to,from,heading,body)>
        <!ELEMENT to (#PCDATA)>
        <!ELEMENT from (#PCDATA)>
        <!ELEMENT heading (#PCDATA)>
        <!ELEMENT body (#PCDATA)>';


$root = 'note';

$systemId = 'data://text/plain;base64,'.base64_encode($dtd);

$old = new DOMDocument;
$old->loadXML($xml);

$creator = new DOMImplementation;
$doctype = $creator->createDocumentType($root, null, $systemId);
$new = $creator->createDocument(null, null, $doctype);
$new->encoding = "utf-8";

$oldNode = $old->getElementsByTagName($root)->item(0);
$newNode = $new->importNode($oldNode, true);
$new->appendChild($newNode);

if (@$new->validate()) {
    echo "Valid";
} else {
    echo "Not valid";
}
Я хотел бы понизить это за неработающий код (или, по крайней мере, отозвать свое upvote).
больше похоже на то, что код скопированfrom here а затем в сочетании с оберткой данных. @Peter: внешняя загрузка подмножества может быть отключена в вашей конфигурации, она работает.
@Peter - похоже, этот код взят из w3schools (w3fools.com).
Так почему этот код выдает вывод "Неправильно"? Ловушки ошибки из LibXML вижу следующее: & л; б & GT; Ошибка 517 & л; / б & GT ;: Не удалось загрузить внешнее подмножество & Quot; данные: // текст / обычный; base64, PCFFTEVNRU5UIG5vdGUgKHRvLGZyb20saGVhZGluZyxib2R5KT4KICAgICAgICA8IUVMRU1FTlQgdG8gKCNQQ0RBVEEpPgogICAgICAgIDwhRUxFTUVOVCBmcm9tICgjUENEQVRBKT4KICAgICAgICA8IUVMRU1FTlQgaGVhZGluZyAoI1BDREFUQSk + CiAgICAgICAgPCFFTEVNRU5UIGJvZHkgKCNQQ0RBVEEpPg == & Quot; на линии & lt; b & gt; 0 & lt; / b & gt;
Проблема, с которой я столкнулся в приведенном выше коде, по-видимому, связана с вызовом createDocumentType (), который генерирует элемент DOCTYPE. Вот что я хочу (для примера): & lt;! DOCTYPE note [& lt;! ELEMENT note (to, from, heading, body) & gt; & lt;! ELEMENT to (#PCDATA) & gt; ... & lt;! ELEMENT body (#PCDATA) & gt;] & gt; но это то, что я получаю: & л; DOCTYPE примечания SYSTEM & Quot; данные: // текст / равнина; base64, PCFFTEVNRU5UIG5vdGUgKHRvLGZyb20saGVhZGluZyxib2R5KT4KICAgICAgICA8IUVMRU1FTlQgdG8gKCNQQ0RBVEEpPgogICAgICAgIDwhRUxFTUVOVCBmcm9tICgjUENEQVRBKT4KICAgICAgICA8IUVMRU1FTlQgaGVhZGluZyAoI1BDREFUQSk + CiAgICAgICAgPCFFTEVNRU5UIGJvZHkgKCNQQ0RBVEEpPg == & Quot; & GT;
0
Trying to complete "owenmarshall" answer:

in xml-validator.php:

добавить HTML, заголовок, тело, ...

<?php

$dom = new DOMDocument; <br/>
$dom->Load('template-format.xml');<br/>
if ($dom->validate()) { <br/>
    echo "This document is valid!\n"; <br/>
}

?>

template-format.xml:

<?xml, version="1.0" encoding="utf-8"?>

<!-- DTD to Validate against (format example) -->

<!DOCTYPE template-format [  <br/>
  <!ELEMENT template-format (template)>  <br/>
  <!ELEMENT template (background-color, color, font-size, header-image)>  <br/>
  <!ELEMENT background-color   (#PCDATA)>  <br/>
  <!ELEMENT color (#PCDATA)>  <br/>
  <!ELEMENT font-size (#PCDATA)>  <br/>
  <!ELEMENT header-image (#PCDATA)>  <br/>
]>

<!-- XML example -->

<template-format>

<template>

<background-color>&lt;/background-color>  <br/>
<color>&lt;/color>  <br/>
<font-size>&lt;/font-size>  <br/>
<header-image>&lt;/header-image>  <br/>

</template> 

</template-format>
То же самое и здесь, вы не загружаете DTD в любом месте.
В своем примере он интерполировал DTD локально внутри элемента DOCTYPE (это то, что пытается сделать код Сорена, но, похоже, это не работает).
3

что у нас есть «на борту». XML-файл, который мы хотим проверить на соответствие «на борту» DTD файл. Так вот, как бы я реализовал «интерполировать локальный DTD внутри элемента DOCTYPE» Идея, выраженная в комментариях как Сорена, так и PayamRWD:

public function validate($xml_realpath, $dtd_realpath=null) {
    $xml_lines = file($xml_realpath);
    $doc = new DOMDocument;
    if ($dtd_realpath) {
        // Inject DTD inside DOCTYPE line:
        $dtd_lines = file($dtd_realpath);
        $new_lines = array();
        foreach ($xml_lines as $x) {
            // Assume DOCTYPE SYSTEM "blah blah" format:
            if (preg_match('/DOCTYPE/', $x)) {
                $y = preg_replace('/SYSTEM "(.*)"/', " [\n" . implode("\n", $dtd_lines) . "\n]", $x);
                $new_lines[] = $y;
            } else {
                $new_lines[] = $x;
            }
        }
        $doc->loadXML(implode("\n", $new_lines));
    } else {
        $doc->loadXML(implode("\n", $xml_lines));
    }
    // Enable user error handling
    libxml_use_internal_errors(true);
    if (@$doc->validate()) {
        echo "Valid!\n";
    } else {
        echo "Not valid:\n";
        $errors = libxml_get_errors();
        foreach ($errors as $error) {
            print_r($error, true);
        }
    }
}

Обратите внимание, что обработка ошибок была исключена для краткости, и может быть лучший / более общий способ обработки интерполяции. Но яhave фактически использовал этот код с реальными данными, и он работает с версией PHP 5.2.17.

5

PHP DOM, особенноDOMDocument :: schemaValidate а такжеDOMDocument :: Validate.

Пример для DOMDocument :: validate довольно прост:

<?php
$dom = new DOMDocument;
$dom->Load('book.xml');
if ($dom->validate()) {
    echo "This document is valid!\n";
}
?>
@Andrei - Это, безусловно, помогает правильно отображать ошибки валидации, поэтому это вызов winx libxml_use_internal_errors (true) до валидации и libxml_get_errors () после сбоя.
К вашему сведению, в PHP есть ошибка сDOMDocument::validate() bugs.php.net/bug.php?id=48080
uk3.php.net/manual/en/domdocument.schemavalidate.php#62032 похоже, что есть лучший способ, чем пользовательский обработчик ошибок
Единственный способ получить ошибку проверки - использовать пользовательский обработчик ошибок. действительно ужасно php отстой при обработке ошибок
@owenmarshall - я не думаю, что это действительно отвечает на первоначальный вопрос, потому что & quot; book.xml & quot; будет просто проверяться на соответствие DTD, указанному в содержимом book.xml, а не на & quot; custom & quot; DTD указывается вызывающей стороной во время выполнения.

Похожие вопросы