`
SunnyYoona
  • 浏览: 367667 次
社区版块
存档分类
最新评论

[算法系列之二十二]包含T全部元素的最小子窗口

 
阅读更多

题目描述

给定一个包含一系列字符的集合T和字符串S,请在字符串S中找到一个最小的窗口,这个窗口中必须包含T中的所有字符。
例如,
S = “ADOBECODEBANC”
T = “ABC”

最小窗口是“BANC”

分析

这是一个有趣的问题,这个有趣的问题有多种方法来解决,最好的方法是非常简单,美丽的。
在这篇文章中,我首先说明了一个方法,是我第一次遇见这个问题时想到的。我的第一个方法有点复杂,同时也不是最好的解决方案(时间复杂度为O(NlgM))。在这篇文章的后面中,我介绍一个比较好的方法,时间复杂度为O(N)。
Hint:
使用上面的示例中S =“ADOBECODEBANC”,S =“ABC”,我们可以很容易地找到第一个窗口“ADOBEC”,包含了T中所有元素。另一个可能的候选者是“ADOBECODEB A”。事实上,我们应该跳过这个,因为在这个窗口中存在一个子窗口“CODEBA”,既短又满足约束条件。最后考虑的一个窗口是“BANC”,这也是最小的窗口。

为了有效地解决这个问题,下面我们需要考虑的两个关键点:

我们如何确定一个特定的窗口包含T ?(最理想的情况是O(1)时间)。
我们如何有效的选择所有窗口?(最理想的情况是不包括含有子窗口的那些窗口)。

我们绝对需要哈希表(Hash Table)的帮助。哈希表能在O(1)时间内告诉我们一个字符是否在T 中。

O(N lg M) 方法:

当我第一次遇到这一问题,我想到了另一个表,记录字符上次出现的位置。也就是说,当我第一次看到字符’A‘,我记录它的位置是0。我每次再见到’ A ‘,我就用新位置代替它原先的位置。这种方法虽然很简单,但是缺陷也很明显。请注意,T不包含重复的字符吗?如果T包含了重复的字符,如“AABC”,这种方法就不能使用了。

在这种情况下,补救措施是维持一个队列(而不是表),T中每个不同字符对应一个队列(例如:字符A对应一个队列,字符B对应一个队列。。。)。例如,假设T =“AABC”,当你第一次遇到“A”,把它的所在位置放入“A”队列中(最初是空的)。当你再次遇到“A ”时,把它的位置放入“A”队列末尾。第三次遇到“A”时,弹出第一个元素,并把这次遇到的A所在位置放入“A”队列末尾。通过弹出元素,我们不包括那些包含子窗口的窗口。这种方法很有效,但困难是双重的:

我们没有办法从队列本身直接确定窗口的开始和结束位置。一个最自然的方法是扫描整个队列得到最小值和最大值。我们如何确定这个窗口是否满足约束条件呢?我们不得不扫描整个队列来检查所有队列大小总和是否等于T的长度。

我解决上述问题的方法是维护一个sorted map,它映射到每一个字符。这样我们能在O(1)时间内获取最小值和最大值的位置。但这样做会花费额外的时间。每次你从队列中弹出一个元素,你不得不通过删除相应的元素和插入一个新元素来更新map。检查窗口是否满足约束条件,我们必须查看map的大小,如果map的大小等于T的长度就代表找到一个有效的窗口。

这个方法的时间复杂度是O(N lg M),其中N是S的长度,和M是T的长度。额外的lgM是由于在map中删除和插入一个元素的额外花费,每个最坏情况花费O(lgM)时间。(注意,M是map的最大大小。)

/*---------------------------------------------
*   日期:2015-02-24
*   作者:SJF0115
*   题目: 22.包含T全部元素的最小子窗口
*   来源:算法系列
*   博客:
-----------------------------------------------*/
#include <iostream>
#include <map>
#include <queue>
#include <climits>
#include <algorithm>
using namespace std;

bool MinWindow(string s,string t,int &startWin,int &endWin){
    int slen = s.size();
    int tlen = t.size();
    if(slen <= 0 || tlen <= 0){
        return false;
    }//if
    // 存储T中不同字符的总数
    int needFind[256] = {0};
    for(int i = 0;i < tlen;++i){
        ++needFind[t[i]];
    }//for
    // 不在T中的元素设置为-1
    for(int i = 0; i < 256;++i){
        if(needFind[i] == 0){
            needFind[i] = -1;
        }//if
    }//for
    int minWinLen = INT_MAX;
    // 队列数组,每个不同的字符都对应一个队列
    queue<int> q[256];
    // 第一个元素和最后一个元素表明了窗口的开始和结束位置
    map<int,char> m;
    int val;
    for(int i = 0;i < slen;++i){
        val = s[i];
        // 跳过不在T中的元素
        if(needFind[val] == -1) {
            continue;
        }//id
        // 字符放入队列
        if(q[val].size() < needFind[val]) {
            q[val].push(i);
            m[i] = val;
        }//if
        // 取代队列中的字符,更新map中对应元素
        else{
            int idxToErase = q[val].front();
            map<int,char>::iterator it = m.find(idxToErase);
            m.erase(it);
            m[i] = val;
            q[val].pop();
            q[val].push(i);
        }//else
        if(m.size() == tlen){
            int end = m.rbegin()->first;
            int start = m.begin()->first;
            int winLen = end - start + 1;
            if (winLen < minWinLen) {
                minWinLen = winLen;
                startWin = start;
                endWin = end;
            }//if
        }//if
    }//for
    return (m.size() == tlen);
}

int main() {
    string s("acbbaca");
    string t("aba");
    int start,end;
    bool result = MinWindow(s,t,start,end);
    if(result){
        cout<<s.substr(start,end-start+1)<<endl;
    }//if
    else{
        cout<<"未找到"<<endl;
    }//else
    return 0;
}

O(N)方法:

注意到上面的思路是非常复杂的。它使用了一个哈希表,一个队列还有一个sorted map。在面试过程中,给出的问题往往是比较短的,解决方案通常在50行代码左右。所以你有必要大声说出你在想什么,时刻保持与面试官进行沟通。检查你的方法是否是没有必要的复杂,他/她可以给你指导。最不好的就是就是你被困在一点,什么也不说。

为了阐述这个思路,我使用一个不同上面的例子:S = “acbbaca”,T = “aba”。这个思路主要是遍历S时使用了两个指针begin和end(窗口开始和结束位置)和两个数组(needToFind 和 hasFound)。needToFind存储T中不同字符的总数,hasFound存储到目前为止遇到过的不同字符的总数。我们也使用一个count变量来存储到目前为止遇到过的T中字符总数(当hasFound[x]超过needToFind[x]时不用计数)。当count等于T的长度时,我们就找到了一个有效的窗口。

每次我们向前移动end指针(指向一个元素x),我们会使hasFound[x]加一。如果hasFound[x]是小于或等于needToFind[x]时count加一。为什么?当满足约束条件(即count等于T的大小),在满足约束的条件下,我们开尽可能的向右移动begin指针。

我们如何检查是否满足约束条件呢?假设begin指向一个元素x,我们检查hasFound[x]是否大于needToFind[x]。如果是,我们可以使hasFound[x]减一,在不破坏约束条件的前提下向前移动begin指针。相反,如果不是,我们立即停止向前移动begin指针,以防破坏约束条件。

最后,我们检查最小窗口长度是否小于当前的最小窗口长度。如果不是则更新最小窗口长度。

本质上,该算法找到满足约束的第一个窗口后,仍然继续保持约束条件。

这里写图片描述
(1) S = “acbbaca” T = “aba“

这里写图片描述
(2)第一个找到最小的窗口。我们无法向前移动begin指针当hasFound[‘a’]== needToFind[‘a’]= = 2。向前移动意味着打破约束。

这里写图片描述
(3)第二个窗口。begin指针仍然指向第一个元素“a”。hasFound[’ a ‘](3)大于needToFind[‘a’](2)。我们使hasFound[’ a ‘],向右移动begin指针。

这里写图片描述
(4)我们跳过元素c,因为它不在T中。现在begin指针指向元素b。hasFound[b](2)大于needToFind[b](1)。我们使hasFound[b]减一,同时向右移动begin指针。

这里写图片描述
(5)begin指针现在指向下一个元素b。hasFound[b](1)等于needToFind[b](1)。我们立即停止,这是我们新发现的最小的窗口。

begin指针和end指针最坏情况下向前移动至多N步(N 是字符串S的长度),加起来是2N时间,因此时间复杂度是O(N)。

/*---------------------------------------------
*   日期:2015-02-24
*   作者:SJF0115
*   题目: 22.包含T全部元素的最小子窗口
*   来源:算法系列
*   博客:
-----------------------------------------------*/
#include <iostream>
#include <climits>
#include <algorithm>
using namespace std;

// Returns false if no valid window is found. Else returns
// true and updates start and end with the
// starting and ending position of the minimum window.
bool MinWindow(string s,string t,int &startWin,int &endWin){
    int slen = s.size();
    int tlen = t.size();
    if(slen <= 0 || tlen <= 0){
        return false;
    }//if
    // 存储T中不同字符的总数
    int needFind[256] = {0};
    for(int i = 0;i < tlen;++i){
        ++needFind[t[i]];
    }//for
    // 存储到目前为止遇到过的不同字符的总数
    int hasFound[256] = {0};
    // 存储到目前为止遇到过的T中字符总数
    int count = 0;
    int minWin = INT_MAX;
    int endEle;
    for(int start = 0,end = 0;end < slen;++end){
        endEle = s[end];
        // 剪枝 无用字符(T中字符为有用字符)
        if(needFind[endEle] == 0){
            continue;
        }//if
        ++hasFound[endEle];
        if(hasFound[endEle] <= needFind[endEle]){
            ++count;
        }//if
        // 找到一个有效窗口
        if(count == tlen){
            int begEle = s[start];
            // 满足:字符为无用字符,begEle元素找多了 start指针才向右移动
            while(needFind[begEle] == 0 || hasFound[begEle] > needFind[begEle]){
                if(hasFound[begEle] > needFind[begEle]){
                   --hasFound[begEle];
                }//if
                ++start;
                begEle = s[start];
            }//while
            // 更新最小窗口
            int curWin = end - start + 1;
            if(curWin < minWin){
                minWin = curWin;
                startWin = start;
                endWin = end;
            }//if
        }//if
    }//while
    return (count == tlen);
}

int main() {
    string s("ADOBECODEBANC");
    string t("ABC");
    int start,end;
    bool result = MinWindow(s,t,start,end);
    if(result){
        cout<<s.substr(start,end-start+1)<<endl;
    }//if
    else{
        cout<<"未找到"<<endl;
    }//else
    return 0;
}

原文链接:Finding the Minimum Window in S which Contains All Elements from T

<script type="text/javascript"> $(function () { $('pre.prettyprint code').each(function () { var lines = $(this).text().split('\n').length; var $numbering = $('<ul/>').addClass('pre-numbering').hide(); $(this).addClass('has-numbering').parent().append($numbering); for (i = 1; i <= lines; i++) { $numbering.append($('<li/>').text(i)); }; $numbering.fadeIn(1700); }); }); </script>
分享到:
评论

相关推荐

    机械设计同轴剥皮机sw18可编辑非常好的设计图纸100%好用.zip

    机械设计同轴剥皮机sw18可编辑非常好的设计图纸100%好用.zip

    node-v12.22.5-linux-arm64.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    Honeywell BR-310 条形码扫描器手册

    Honeywell BR-310 条形码扫描器手册

    中国诗词APP「西窗烛」产品需求文档.docx

    中国诗词APP「西窗烛」产品需求文档

    unity开发的教程.doc

    当然可以!Unity开发是一个非常受欢迎的游戏开发工具,适合初学者入门。以下是一些Unity开发的教程,供您参考: 1. Unity官方文档:Unity官方网站提供了详细的文档和教程,包括Unity的基本概念、工具使用、场景编辑、游戏逻辑编写等。您可以根据自己的需求和水平选择相应的教程。 2. Unity官方的Unity Creator在线课程:Unity Creator是Unity的在线教育平台,提供了许多免费的Unity Creator教程和课程,适合初学者入门。您可以根据教程的内容和难度选择适合自己的课程。 3. Unity中文社区:Unity中文社区是一个非常活跃的社区,提供了许多Unity开发的教程和资源。您可以搜索相关的教程和资源,与其他开发者交流和学习。 4. Unity教程网站:有许多网站提供了Unity开发的教程和资源,如游戏学院、编程教室等。这些网站提供了许多基础和进阶的Unity开发教程,适合初学者和有一定基础的开发者。 5. Unity插件开发:Unity插件开发是Unity开发的一个重要方向,适合有一定基础的开发者。您可以学习如何创建自定义的Unity插件,

    node-v12.19.1-linux-arm64.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    惠普服务器安装说明

    惠普服务器安装说明

    node-v12.18.2-linux-s390x.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    node-v12.22.4-linux-ppc64le.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    python烟花代码示例

    附件是一个简单的烟花效果的代码示例。 在Python中,可以使用多种方式来模拟烟花效果,其中一种常用的方法是使用turtle模块,它提供了一个画布和一个小海龟,可以用来绘制各种图形。 这段代码首先导入了turtle模块和random模块,然后在屏幕上绘制了10次烟花爆炸的效果。每次爆炸都是由5个小圆组成,颜色随机选择,圆的大小也是随机的。 请注意,这段代码需要在支持turtle模块的Python环境中运行,并且需要有图形界面的支持。如果你在没有图形界面的环境中(比如某些服务器或者命令行界面),这段代码可能无法正常运行。

    基于MATLAB和Simulink通过正运动学和逆运动学设计了PID控制器.zip

    基于MATLAB和Simulink通过正运动学和逆运动学设计了PID控制器.zip基于MATLAB和Simulink通过正运动学和逆运动学设计了PID控制器.zip基于MATLAB和Simulink通过正运动学和逆运动学设计了PID控制器.zip基于MATLAB和Simulink通过正运动学和逆运动学设计了PID控制器.zip基于MATLAB和Simulink通过正运动学和逆运动学设计了PID控制器.zip基于MATLAB和Simulink通过正运动学和逆运动学设计了PID控制器.zip

    基于python的深度学习的声学回声消除基线代码

    基于深度学习的声学回声消除基线代码 # 数据准备 按照以下文件结构,放好语音,我直接使用的是AEC-Challenge 数据集中的合成数据集 ```angular2html └─Synthetic ├─TEST │ ├─echo_signal │ ├─farend_speech │ ├─nearend_mic_signal │ └─nearend_speech ├─TRAIN │ ├─echo_signal │ ├─farend_speech │ ├─nearend_mic_signal │ └─nearend_speech └─VAL ├─echo_signal ├─farend_speech ├─nearend_mic_signal └─nearend_speech ``` 数据处理脚本为 `data_preparation.py`

    Dell Edge Gateway 3002 安装和操作手册

    Dell Edge Gateway 3002 安装和操作手册

    88888888888.mp3

    88888888888.mp3

    Java毕设之ssm002学院党员管理系统+jsp.rar

    环境说明: 开发语言:java 框架:springboot,vue JDK版本:JDK1.8 数据库:mysql5.7+(推荐5.7,8.0也可以) 数据库工具:Navicat11+ 开发软件:idea/eclipse(推荐idea) Maven包:Maven3.3.9+

    node-v12.18.4-linux-s390x.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    KR-18 y KR-24 INSTALACIÓN INTRODUCCIÓN

    KR-18 y KR-24 INSTALACIÓN INTRODUCCIÓN KR-18 和 KR-24 安装说明

    node-v12.22.4-linux-s390x.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    Qt开发的教程.doc

    Qt开发是一种使用Qt库进行应用程序开发的强大技术。Qt是一个跨平台的C++应用程序开发框架,它提供了许多用于创建图形用户界面(GUI)和网络应用程序的工具。 以下是一个简单的Qt开发教程,它涵盖了Qt的主要概念和基本步骤: **步骤1:安装Qt** 首先,你需要安装Qt库。你可以从Qt官方网站下载并安装它。安装完成后,你还需要安装一些开发工具,如Qt Creator。 **步骤2:创建你的第一个Qt项目** 在Qt Creator中创建一个新的项目。你可以选择创建一个简单的窗口应用程序,这将为你提供一个基本的框架来开始你的开发工作。 **步骤3:理解Qt的基本概念** 理解Qt的基本概念是学习Qt开发的关键。这些概念包括窗口、控件、布局、信号和槽等。理解这些概念将帮助你更好地理解如何使用Qt库来创建GUI应用程序。 **步骤4:学习布局系统** Qt的布局系统允许你轻松地管理窗口中的控件位置。理解布局系统将帮助你创建具有整洁和一致外观的GUI应用程序。 **步骤5:使用信号和槽** 信号和槽是Qt中用于处理事件和交互的主要机制。学习如何使用信号和槽来连接控件的行

    一体式离子传感器 用户手册 PR-3003

    一体式离子传感器 用户手册 一体式离子传感器 用户手册 (485 型) PR-3003-*-N01-* Ver 1.0

Global site tag (gtag.js) - Google Analytics