将用户输入字符串转换为正则表达式

2020/10/02 11:41 · javascript ·  · 0评论

我正在设计HTML和JavaScript中的正则表达式测试器。用户将输入一个正则表达式,一个字符串,并通过单选按钮选择要测试的函数(例如,搜索,匹配,替换等),并且当该函数以指定的参数运行时,程序将显示结果。自然地,会有额外的文本框来替换这些额外的参数。

我的问题是从用户那里获取字符串并将其转换为正则表达式。如果我说他们不需要//在输入的正则表达式中包含,则他们不能设置标志,例如gi因此,它们必须//在表达式周围包含,但是如何将字符串转换为正则表达式?它不能是文字,因为它是一个字符串,我不能将其传递给RegExp构造函数,因为它不是没有//s的字符串还有其他方法可以使用户输入字符串进入正则表达式吗?我是否需要使用来解析regex的字符串和标志,//然后以其他方式构造它?我应该让他们输入一个字符串,然后分别输入标志吗?

使用RegExp对象构造函数从字符串创建正则表达式:

var re = new RegExp("a|b", "i");
// same as
var re = /a|b/i;
var flags = inputstring.replace(/.*\/([gimy]*)$/, '$1');
var pattern = inputstring.replace(new RegExp('^/(.*?)/'+flags+'$'), '$1');
var regex = new RegExp(pattern, flags);

要么

var match = inputstring.match(new RegExp('^/(.*?)/([gimy]*)$'));
// sanity check here
var regex = new RegExp(match[1], match[2]);

这里是单线: str.replace(/[|\\{}()[\]^$+*?.]/g, '\\$&')

我从escape-string-regexp NPM模块获得了它

尝试一下:

escapeStringRegExp.matchOperatorsRe = /[|\\{}()[\]^$+*?.]/g;
function escapeStringRegExp(str) {
    return str.replace(escapeStringRegExp.matchOperatorsRe, '\\$&');
}

console.log(new RegExp(escapeStringRegExp('example.com')));
// => /example\.com/

将标记的模板文字与标志一起使用:

function str2reg(flags = 'u') {
    return (...args) => new RegExp(escapeStringRegExp(evalTemplate(...args))
        , flags)
}

function evalTemplate(strings, ...values) {
    let i = 0
    return strings.reduce((str, string) => `${str}${string}${
        i < values.length ? values[i++] : ''}`, '')
}

console.log(str2reg()`example.com`)
// => /example\.com/u

使用JavaScript RegExp对象构造函数

var re = new RegExp("\\w+");
re.test("hello");

您可以将标志作为第二个字符串参数传递给构造函数。有关详细信息,请参见文档。

在我的情况下,用户输入somethimes由定界符引起,有时不是。因此,我添加了另一种情况。

var regParts = inputstring.match(/^\/(.*?)\/([gim]*)$/);
if (regParts) {
    // the parsed pattern had delimiters and modifiers. handle them. 
    var regexp = new RegExp(regParts[1], regParts[2]);
} else {
    // we got pattern string without delimiters
    var regexp = new RegExp(inputstring);
}

我建议您还为特殊标志添加单独的复选框或文本字段。这样,很明显,用户不需要添加任何//如果是替换,请提供两个文本字段。这将使您的生活更加轻松。

为什么?因为否则某些用户将添加//,而其他用户则不会。而且有些会产生语法错误。然后,在删除了//'之后,您可能会得到一个语法上有效的正则表达式,它与用户的意图完全不同,从而导致奇怪的行为(从用户的角度而言)。

尝试使用以下功能:

const stringToRegex = str => {
    // Main regex
    const main = str.match(/\/(.+)\/.*/)[1]
    
    // Regex options
    const options = str.match(/\/.+\/(.*)/)[1]
    
    // Compiled regex
    return new RegExp(main, options)
}

您可以这样使用它:

"abc".match(stringToRegex("/a/g"))
//=> ["a"]

当字符串无效或不包含标志等时,这也将起作用:

function regExpFromString(q) {
  let flags = q.replace(/.*\/([gimuy]*)$/, '$1');
  if (flags === q) flags = '';
  let pattern = (flags ? q.replace(new RegExp('^/(.*?)/' + flags + '$'), '$1') : q);
  try { return new RegExp(pattern, flags); } catch (e) { return null; }
}

console.log(regExpFromString('\\bword\\b'));
console.log(regExpFromString('\/\\bword\\b\/gi'));
            

多亏了前面的回答,此块很好地用作了将可配置字符串应用于RegEx ..以过滤文本的通用解决方案:

var permittedChars = '^a-z0-9 _,.?!@+<>';
permittedChars = '[' + permittedChars + ']';

var flags = 'gi';
var strFilterRegEx = new RegExp(permittedChars, flags);

log.debug ('strFilterRegEx: ' + strFilterRegEx);

strVal = strVal.replace(strFilterRegEx, '');
// this replaces hard code solt:
// strVal = strVal.replace(/[^a-z0-9 _,.?!@+]/ig, '');

您可以使用复选框请求标志,然后执行以下操作:

var userInput = formInput;
var flags = '';
if(formGlobalCheckboxChecked) flags += 'g';
if(formCaseICheckboxChecked) flags += 'i';
var reg = new RegExp(userInput, flags);

eval用来解决这个问题。

例如:

    function regex_exec() {

        // Important! Like @Samuel Faure mentioned, Eval on user input is a crazy security risk, so before use this method, please take care of the security risk. 
        var regex = $("#regex").val();

        // eval()
        var patt = eval(userInput);

        $("#result").val(patt.exec($("#textContent").val()));
    }
本文地址:http://javascript.askforanswer.com/jiangyonghushuruzifuchuanzhuanhuanweizhengzebiaodashi.html
文章标签: ,   ,  
版权声明:本文为原创文章,版权归 javascript 所有,欢迎分享本文,转载请保留出处!

文件下载

老薛主机终身7折优惠码boke112

上一篇:
下一篇:

评论已关闭!