如何在mysql中拆分名称字符串?

Posted

技术标签:

【中文标题】如何在mysql中拆分名称字符串?【英文标题】:How to split the name string in mysql? 【发布时间】:2013-02-03 17:16:24 【问题描述】:

例如:

name
-----
Sachin ramesh tendulkar
Rahul dravid

拆分名称如firstname,middlename,lastname:

firstname   middlename    lastname
---------  ------------   ------------
sachin     ramesh         tendulkar
rahul      dravid

【问题讨论】:

当您的表格正确规范化时,您对此没有任何问题。 您不需要拆分值。 Can you split/explode a field in a mysql query? 的可能重复项 @JW。不幸的是,名字特别难取。 kalzumeus.com/2010/06/17/… @Madhav 如果任何答案解决了您的问题,请单击已解决...提示提示;) 试图找出名字的一部分是“名字”或“姓氏”是悲伤的道路。并非所有名称都是由空格分隔的两个“单词”。考虑 Eddie Van Halen(姓氏 2 个字)或 Zack de la Rocha(姓氏 3 个字)或 Jerry Lee Lewis(姓氏 2 个字)。不要忘记像 Olivia Newton-John 和 Yo-Yo Ma 这样的连字符或像 Sinead O'Connor 这样的撇号。你不会有一个基于模式的一致准确的方法来完成这项任务。 【参考方案1】:

我已将此答案分为两 (2) 种方法。第一种方法会将您的全名字段分为名字、中间名和姓氏。如果没有中间名,中间名将显示为 NULL。

SELECT
   SUBSTRING_INDEX(SUBSTRING_INDEX(fullname, ' ', 1), ' ', -1) AS first_name,
   If(  length(fullname) - length(replace(fullname, ' ', ''))>1,  
       SUBSTRING_INDEX(SUBSTRING_INDEX(fullname, ' ', 2), ' ', -1) ,NULL) 
           as middle_name,
   SUBSTRING_INDEX(SUBSTRING_INDEX(fullname, ' ', 3), ' ', -1) AS last_name
FROM registeredusers

第二种方法将中间名视为姓氏的一部分。我们只会从您的全名字段中选择名字和姓氏列。

SELECT
   SUBSTRING_INDEX(SUBSTRING_INDEX(fullname, ' ', 1), ' ', -1) AS first_name,
    TRIM( SUBSTR(fullname, LOCATE(' ', fullname)) ) AS last_name
FROM registeredusers

你可以用 substr、locate、substring_index 等做很多很酷的事情。查看手册是否有一些真正的困惑。 http://dev.mysql.com/doc/refman/5.0/en/string-functions.html

【讨论】:

天哪,英特尔刚刚让我觉得自己拥有 mysql 专业技能。我已经完全删除了 php 处理并在一个查询中转换了 100 行逻辑。这太棒了! 真的很好。正是我所需要的,并且可能比他希望的更好地解决了提问者问题事件,因为在两个词的情况下,只有名字和姓氏被设置,而不是名字和中间名。 第一种方法对我帮助很大。我看到的唯一问题是姓“St. George”被选为中间名“St.”。 您好先生,我知道这是一个旧线程。如果这个人有扩展名怎么办? @TrafalgarDLaw 我在上面发布了一个解决方案。 - ***.com/a/44802256/3542883【参考方案2】:

MySQL 中没有字符串拆分功能。所以你必须创建自己的功能。这将对您有所帮助。 More details at this link.

功能:

CREATE FUNCTION SPLIT_STR(
  x VARCHAR(255),
  delim VARCHAR(12),
  pos INT
)
RETURNS VARCHAR(255)
RETURN REPLACE(SUBSTRING(SUBSTRING_INDEX(x, delim, pos),
       LENGTH(SUBSTRING_INDEX(x, delim, pos -1)) + 1),
       delim, '');

用法:

SELECT SPLIT_STR(string, delimiter, position)

示例:

SELECT SPLIT_STR('a|bb|ccc|dd', '|', 3) as third;

+-------+
| third |
+-------+
| ccc   |
+-------+

【讨论】:

这是迄今为止最好的答案 最佳答案,我绝对用它?✨ 这对我来说是最好的解决方案【参考方案3】:

好吧,我用的都没有用,所以我决定创建一个真正简单的拆分函数,希望对您有所帮助:

DECLARE inipos INTEGER;
DECLARE endpos INTEGER;
DECLARE maxlen INTEGER;
DECLARE item VARCHAR(100);
DECLARE delim VARCHAR(1);

SET delim = '|';
SET inipos = 1;
SET fullstr = CONCAT(fullstr, delim);
SET maxlen = LENGTH(fullstr);

REPEAT
    SET endpos = LOCATE(delim, fullstr, inipos);
    SET item =  SUBSTR(fullstr, inipos, endpos - inipos);

    IF item <> '' AND item IS NOT NULL THEN           
        USE_THE_ITEM_STRING;
    END IF;
    SET inipos = endpos + 1;
UNTIL inipos >= maxlen END REPEAT;

【讨论】:

您还必须检查最后一项的endpos;因为对于最后一项,endpos 将为零,并且此 while 循环将永远持续下去。我的建议是最初将布尔变量设置为 false 并在 endpos = 0 和退出直到循环中将其设置为 true 并检查此标志 = true。【参考方案4】:

这是我使用的拆分功能:

--
-- split function
--    s   : string to split
--    del : delimiter
--    i   : index requested
--

DROP FUNCTION IF EXISTS SPLIT_STRING;

DELIMITER $

CREATE FUNCTION 
   SPLIT_STRING ( s VARCHAR(1024) , del CHAR(1) , i INT)
   RETURNS VARCHAR(1024)
   DETERMINISTIC -- always returns same results for same input parameters
    BEGIN

        DECLARE n INT ;

        -- get max number of items
        SET n = LENGTH(s) - LENGTH(REPLACE(s, del, '')) + 1;

        IF i > n THEN
            RETURN NULL ;
        ELSE
            RETURN SUBSTRING_INDEX(SUBSTRING_INDEX(s, del, i) , del , -1 ) ;        
        END IF;

    END
$

DELIMITER ;


SET @agg = "G1;G2;G3;G4;" ;

SELECT SPLIT_STRING(@agg,';',1) ;
SELECT SPLIT_STRING(@agg,';',2) ;
SELECT SPLIT_STRING(@agg,';',3) ;
SELECT SPLIT_STRING(@agg,';',4) ;
SELECT SPLIT_STRING(@agg,';',5) ;
SELECT SPLIT_STRING(@agg,';',6) ;

【讨论】:

这对我来说效果很好,并且没有像接受的答案那样导致无限循环(不清楚为什么) - 但它不适用于空格作为分隔符。对于遇到此问题的任何人 - 请查看 ***.com/questions/2696884/…。 如果您的分隔符大于一,那么您还需要将长度差除以您的分隔符长度。 将定义从 SPLIT_STRING ( s VARCHAR(1024) , del CHAR(1) , i INT) 更改为 SPLIT_STRING ( s VARCHAR(1024) , del VARCHAR(1) , i INT) 并且它适用于空格【参考方案5】:

你也可以使用 bewlo one:

SELECT SUBSTRING_INDEX(Name, ' ', 1) AS fname,
SUBSTRING_INDEX(SUBSTRING_INDEX(Name,' ', 2), ' ',-1) AS mname,
SUBSTRING_INDEX(Name, ' ', -1) as lname FROM mytable;

【讨论】:

这对我有用。我觉得这是不好的做法,但我运行了相同的查询来复制我的 case 语句,发现这种方法的速度是原来的两倍。谢谢。【参考方案6】:
select (case when locate('(', LocationName) = 0 
        then 
            horse_name
        else 
           left(LocationName, locate('(', LocationName) - 1)
       end) as Country            
from   tblcountry;

【讨论】:

【参考方案7】:

获取空格分隔符的第二个实例之后的其余字符串

SELECT
   SUBSTRING_INDEX(SUBSTRING_INDEX('Sachin ramesh tendulkar', ' ', 1), ' ', -1) AS first_name, 
       SUBSTRING_INDEX(SUBSTRING_INDEX('Sachin ramesh tendulkar', ' ', 2), ' ', -1) 
           AS middle_name,
   SUBSTRING('Sachin ramesh tendulkar',LENGTH(SUBSTRING_INDEX('Sachin ramesh tendulkar', ' ', 2))+1) AS last_name

【讨论】:

【参考方案8】:
SELECT
    p.fullname AS 'Fullname',
    SUBSTRING_INDEX(p.fullname, ' ', 1) AS 'Firstname',
    SUBSTRING(p.fullname, LOCATE(' ',p.fullname), 
        (LENGTH(p.fullname) - (LENGTH(SUBSTRING_INDEX(p.fullname, ' ', 1)) + LENGTH(SUBSTRING_INDEX(p.fullname, ' ', -1))))
    ) AS 'Middlename',
    SUBSTRING_INDEX(p.fullname, ' ', -1) AS 'Lastname',
    (LENGTH(p.fullname) - LENGTH(REPLACE(p.fullname, ' ', '')) + 1) AS 'Name Qt'
FROM people AS p
LIMIT 100; 

说明:

查找名字和姓氏很容易,您只需使用 SUBSTR_INDEX 函数 魔术发生在中间名中,其中使用 SUBSTR 和 Locate 来查找第一个空格位置和全名的 LENGTH - (LENGTH firstname + LENGTH lastname) 以获取所有中间名。

请注意,名字和姓氏的长度是使用 SUBSTR_INDEX 计算的

【讨论】:

【参考方案9】:
concat(upper(substring(substring_index(NAME, ' ', 1) FROM 1 FOR 1)), lower(substring(substring_index(NAME, ' ', 1) FROM 2 FOR length(substring_index(NAME, ' ', 1))))) AS fname,
CASE 
WHEN length(substring_index(substring_index(NAME, ' ', 2), ' ', -1)) > 2 THEN 
  concat(upper(substring(substring_index(substring_index(NAME, ' ', 2), ' ', -1) FROM 1 FOR 1)), lower(substring(substring_index(substring_index(f.nome, ' ', 2), ' ', -1) FROM 2 FOR length(substring_index(substring_index(f.nome, ' ', 2), ' ', -1)))))
  ELSE 
  CASE 
  WHEN length(substring_index(substring_index(f.nome, ' ', 3), ' ', -1)) > 2 THEN 
    concat(upper(substring(substring_index(substring_index(f.nome, ' ', 3), ' ', -1) FROM 1 FOR 1)), lower(substring(substring_index(substring_index(f.nome, ' ', 3), ' ', -1) FROM 2 FOR length(substring_index(substring_index(f.nome, ' ', 3), ' ', -1)))))
  END 
END 
AS mname

【讨论】:

【参考方案10】:

您可以使用common_schema 和tokenize 函数。有关这方面的更多信息,请点击链接。你的代码最终会是这样的:

call tokenize(name, ' ');

但是,请注意,空格不是名字和姓氏的可靠分隔符。例如。在西班牙,通常有两个姓氏。

【讨论】:

我不知道这个库,很棒的提示,谢谢【参考方案11】:
CREATE DEFINER=`root`@`localhost` FUNCTION `getNameInitials`(`fullname` VARCHAR(500), `separator` VARCHAR(1)) RETURNS varchar(70) CHARSET latin1
    DETERMINISTIC
BEGIN
DECLARE `result` VARCHAR(500) DEFAULT '';
DECLARE `position` TINYINT;



SET `fullname` = TRIM(`fullname`);

SET `position` = LOCATE(`separator`, `fullname`);

IF NOT `position`
THEN RETURN LEFT(`fullname`,1);
END IF;

SET `fullname` = CONCAT(`fullname`,`separator`);
SET `result` = LEFT(`fullname`, 1);

cycle: LOOP
    SET `fullname` = SUBSTR(`fullname`, `position` + 1);
    SET `position` = LOCATE(`separator`, `fullname`);

    IF NOT `position` OR NOT LENGTH(`fullname`)
    THEN LEAVE cycle;
    END IF;

    SET `result` = CONCAT(`result`,LEFT(`fullname`, 1));
   -- SET `result` = CONCAT_WS(`separator`, `result`, `buffer`);
END LOOP cycle;

RETURN upper(`result`);
END

1.在mysql中执行这个函数。 2.这将创建一个函数。现在你可以在任何你想要的地方使用这个功能了。

 SELECT `getNameInitials`('Kaleem Ul Hassan', ' ') AS `NameInitials`;

3。上面的 getNameInitails 第一个参数是要过滤的字符串,第二个参数是要分隔字符串的旁观者角色。 4.在上面的例子中,'Kaleem Ul Hassan'是名字,我想得到首字母,我的分隔符是空格''。

【讨论】:

【参考方案12】:

我们将课程名称和章节名称的值存储在单列章节名称中。

值存储如下:“JAVA:多态性”

您需要检索 CourseName : JAVA 和 ChapterName : Polymorphism

下面是要检索的 SQL 选择查询。

       SELECT   
          SUBSTRING_INDEX(SUBSTRING_INDEX(ChapterName, ' ', 1), ' ', -1) AS 
       CourseName,

       REPLACE(TRIM(SUBSTR(ChapterName, LOCATE(':', ChapterName)) ),':','') AS 
       ChapterName
       FROM Courses where `id`=1;

如果对此有任何疑问,请告诉我。

【讨论】:

【参考方案13】:

获取空格分隔符的第二个实例之后的其余字符串:

SELECT SUBSTRING_INDEX(SUBSTRING_INDEX(MsgRest, ' ', 1), ' ', -1) AS EMailID
,  SUBSTRING_INDEX(SUBSTRING_INDEX(MsgRest, ' ', 2), ' ', -1) AS DOB
,  IF(
    LOCATE(' ', `MsgRest`) > 0,
    TRIM(SUBSTRING(SUBSTRING(`MsgRest`, LOCATE(' ', `MsgRest`) +1), 
         LOCATE(' ', SUBSTRING(`MsgRest`, LOCATE(' ', `MsgRest`) +1)) +1)),
    NULL
) AS Person
FROM inbox

【讨论】:

【参考方案14】:

DELIMITER $$

DROP FUNCTION IF EXISTS `split_name`$$

CREATE FUNCTION split_name (p_fullname TEXT, p_part INTEGER)
RETURNS TEXT
    READS SQL DATA
BEGIN
    DECLARE v_words INT UNSIGNED;
    DECLARE v_name TEXT;

    SET p_fullname=RTRIM(LTRIM(p_fullname));

    SET v_words=(SELECT SUM(LENGTH(p_fullname) - LENGTH(REPLACE(p_fullname, ' ', ''))+1));

    IF v_words=1 THEN 
        IF p_part=1 THEN
            SET v_name=p_fullname;
        ELSEIF p_part=2 THEN
            SET v_name=NULL;
        ELSEIF p_part=3 THEN
            SET v_name=NULL;
        ELSE
            SET v_name=NULL;
        END IF; 
    ELSEIF v_words=2 THEN 
        IF p_part=1 THEN
            SET v_name=SUBSTRING(p_fullname, 1, LOCATE(' ', p_fullname) - 1);
        ELSEIF p_part=2 THEN
            SET v_name=SUBSTRING(p_fullname, LOCATE(' ', p_fullname) + 1);
        ELSEIF p_part=3 THEN
            SET v_name=NULL;
        ELSE
            SET v_name=NULL;
        END IF; 
    ELSEIF v_words=3 THEN 
        IF p_part=1 THEN
            SET v_name=SUBSTRING(p_fullname, 1, LOCATE(' ', p_fullname) - 1);
        ELSEIF p_part=2 THEN
            SET p_fullname=SUBSTRING(p_fullname, LOCATE(' ', p_fullname) + 1);
            SET v_name=SUBSTRING(p_fullname, 1, LOCATE(' ', p_fullname) - 1);
        ELSEIF p_part=3 THEN
            SET p_fullname=REVERSE (SUBSTRING(p_fullname, LOCATE(' ', p_fullname) + 1));
            SET p_fullname=SUBSTRING(p_fullname, 1, LOCATE(' ', p_fullname) - 1);
            SET v_name=REVERSE(p_fullname);
        ELSE
            SET v_name=NULL;
        END IF; 
    ELSEIF v_words>3 THEN 
        IF p_part=1 THEN
            SET v_name=SUBSTRING(p_fullname, 1, LOCATE(' ', p_fullname) - 1);
        ELSEIF p_part=2 THEN
            SET p_fullname=REVERSE(SUBSTRING(p_fullname, LOCATE(' ', p_fullname) + 1));
            SET p_fullname=SUBSTRING(p_fullname, LOCATE(' ', p_fullname,SUBSTRING_INDEX(p_fullname,' ',1)+1) + 1);
            SET v_name=REVERSE(p_fullname);
        ELSEIF p_part=3 THEN
            SET p_fullname=REVERSE (SUBSTRING(p_fullname, LOCATE(' ', p_fullname) + 1));
            SET p_fullname=SUBSTRING(p_fullname, 1, LOCATE(' ', p_fullname) - 1);
            SET v_name=REVERSE(p_fullname);
        ELSE
            SET v_name=NULL;
        END IF;
    ELSE
        SET v_name=NULL;
    END IF;
 RETURN v_name; 
END;

SELECT split_name('Md. Obaidul Haque Sarker',1) AS first_name,
split_name('Md. Obaidul Haque Sarker',2) AS middle_name,
split_name('Md. Obaidul Haque Sarker',3) AS last_name

【讨论】:

【参考方案15】:

首先创建过程如下:

CREATE DEFINER=`root`@`%` PROCEDURE `sp_split`(str nvarchar(6500), dilimiter varchar(15), tmp_name varchar(50))
BEGIN

    declare end_index   int;
    declare part        nvarchar(6500);
    declare remain_len  int;

    set end_index      = INSTR(str, dilimiter);

    while(end_index   != 0) do

        /* Split a part */
        set part       = SUBSTRING(str, 1, end_index - 1);

        /* insert record to temp table */
        call `sp_split_insert`(tmp_name, part);

        set remain_len = length(str) - end_index;
        set str = substring(str, end_index + 1, remain_len);

        set end_index  = INSTR(str, dilimiter);

    end while;

    if(length(str) > 0) then

        /* insert record to temp table */
        call `sp_split_insert`(tmp_name, str);

    end if;

END

创建过程如下:

CREATE DEFINER=`root`@`%` PROCEDURE `sp_split_insert`(tb_name varchar(255), tb_value nvarchar(6500))
BEGIN
    SET @sql = CONCAT('Insert Into ', tb_name,'(item) Values(?)'); 
    PREPARE s1 from @sql;
    SET @paramA = tb_value;
    EXECUTE s1 USING @paramA;
END

如何调用测试

CREATE DEFINER=`root`@`%` PROCEDURE `test_split`(test_text nvarchar(255))
BEGIN

    create temporary table if not exists tb_search
        (
            item nvarchar(6500)
        );

    call sp_split(test_split, ',', 'tb_search');

    select * from tb_search where length(trim(item)) > 0;

    drop table tb_search;

END


call `test_split`('Apple,Banana,Mengo');

【讨论】:

【参考方案16】:

结合这里的几个答案来创建一个返回字符串部分的 SP。

drop procedure if exists SplitStr;
DELIMITER ;;
CREATE PROCEDURE `SplitStr`(IN Str VARCHAR(2000), IN Delim VARCHAR(1))  
    BEGIN
        DECLARE inipos INT;
        DECLARE endpos INT;
        DECLARE maxlen INT;
        DECLARE fullstr VARCHAR(2000);
        DECLARE item VARCHAR(2000);
        create temporary table if not exists tb_split
        (
            item varchar(2000)
        );



        SET inipos = 1;
        SET fullstr = CONCAT(Str, delim);
        SET maxlen = LENGTH(fullstr);

        REPEAT
            SET endpos = LOCATE(delim, fullstr, inipos);
            SET item =  SUBSTR(fullstr, inipos, endpos - inipos);

            IF item <> '' AND item IS NOT NULL THEN           
                insert into tb_split values(item);
            END IF;
            SET inipos = endpos + 1;
        UNTIL inipos >= maxlen END REPEAT;

        SELECT * from tb_split;
        drop table tb_split;
    END;;
DELIMITER ;

【讨论】:

【参考方案17】:

根据之前的答案,做一些修改...

注意:

p_delimiter 必须是 VARCHAR(1) 可能是 CHAR(1) 如果是 ' '(空格)给出 ''(删除空格并返回空字符串)

而不是使用LENGTH 我更喜欢CHAR_LENGTH,这对于像UTF 这样的多字节字符是安全的

DROP FUNCTION IF EXISTS FN_SPLIT_STR;

DELIMITER ;;

CREATE FUNCTION FN_SPLIT_STR(
    p_input VARCHAR(2000), p_delimiter VARCHAR(1), p_position INT
)
    RETURNS VARCHAR(2000)
    DETERMINISTIC
BEGIN
    DECLARE chunks INT;
    SET chunks := CHAR_LENGTH(p_input) - CHAR_LENGTH(REPLACE(p_input, p_delimiter, '')) + 1;

    IF p_position > chunks THEN
        RETURN NULL;
    END IF;

    RETURN SUBSTRING_INDEX(SUBSTRING_INDEX(p_input, p_delimiter, p_position), p_delimiter, -1);
END;;

DELIMITER ;

【讨论】:

以上是关于如何在mysql中拆分名称字符串?的主要内容,如果未能解决你的问题,请参考以下文章

MySQL数据库,字符串字段拆分

如何从向量中拆分字符串[重复]

在 Python DataFrame 中拆分字符串

在数值中拆分/分解mysql字符串

在sql中拆分字符串并反转它的函数

如何使用scala拆分字符串?